Начинаем подготовку к внесению в общую базу данных всех фотографий фиалок, опубликованных на Fialki.ru.
Сейчас к ним есть доступ только через поиск по сайту [2] да и то только если известно название. В единой базе каждая фотография будет описана по многим параметрам. Это позволит использовать базу самыми разными способами:.
- для любования (например, посмотреть синие махровые пестролистники)
- для составления каталога (авторы блогов увидят все опубликованные сорта в своем личном каталоге)
- для поиска сортов по названию, даже написанному с ошибками
- для самостоятельного опознания роботом-опознавателем [3]
- для программы подбора пар при селекции фиалок [4]
- ...
Ввод параметров фиалки
Прошлой весной из многих десятков параметров, описывающих фиалки [5], сообщество выбрало 17 самых интересных параметров.
При работе с базой данных фиалководка вводит те параметры, в которых уверена. Добровольцы, пополняющие базу, вводят данные относительно очередной фотографии фиалки на сайте. Владелица безымянной фиалки вводит данные о фиалке, которую держит перед собой. Если какой-то параметр недоступен, он пропускается.
Каждый вариант параметра помечен специальным кодом из латинской буквы и 1-2 цифр:
Бутон
|
Листва | Розетка |
|
|
|
После ввода известных параметров фиалки нажимается кнопка:
- , если добавляется фото в базу
- , если подыскиваются похожие сорта.
Из указанных признаков для фиалки составляется код. Он выглядит примерно так:
m1c33k2f3g2n0d7p2i1t1h0s0v1a0u2r18o24
При добавлении сорта в базу сохраняется код сорта и адрес фото. При поиске похожих фотографий фиалководка пересылается на страницу:
Fialki.ru/sorta?m1c33k2f3g2n0d7p2i1t1h0s0v1a0u2r18o24
где выдаются 20-50 фотографий сортов, у которых код чуть-чуть отличается от заданного в поиске. В начале поиска похожих фиалок будут выданы сорта с практически идентичным кодом.
Код сорта
Код сорта это не нечто неподвижное и вечное. У разных образцов сорта коды будут неизбежно немого отличаться ("плавать"). Но в целом любые образцы сорта будут иметь довольно похожий код, отличающиеся всего лишь в 5-10% параметров. А разные сорта будут отличаться по коду на 20% и более процентов. Это позволяет элементарно искать по базе похожие сорта.
Запоминать кодировку нет обязательно. Код составляется автоматически в зависимости от выбранных вариантов из выпадающих меня. Но может случится такое, что на каком-то форуме вы увидели фиалку на опознание. Если помните некоторые буквы кода, то можете прямо на память ответить:
"Посмотрите варианты на Fialki.ru/sorta?m2f0p1k0c2h2"
что приведет к поиску фиалок, похожих на махровую зеленую анютку-пестролистник с холмистыми краями листьев.
Но если зайдете на страницу робота-опознавателя и введете больше параметров, то поиск будет более тщательный и просеивать нужно будет меньше вариантов.
Цвет
Изначально цвет принимает в коде 6 значений:
- c0, белый
- c1, желтый
- c2, зеленый
- c3, синий
- c4, фиолетовый
- c5, вишневый
При необходимости для уточнения цвета можно к значению цвета добавить вторую цифру, означающую степень темноты цвета:
- 0, светлый вариант цвета
- 1, средне-темный вариант цвета
- 2 темный вариант цвета
Например:
- с32, темно-синий
- c50, розовый
Всего для наших фиалковых нужд достаточно 12 стандартных цветов:
При определенной тренировке может различать даже на глаз разницу на фотографиях фиалок между синим/фиолетовым/вишневым и их оттенками. Особенно если рядом будет таблица стандартных цветов в качестве эталона.
Обсуждение
Прежде чем передавать формат кодировки программисту, нужно обсудить его. Возможно, что-то в данной будет неудобно заполнять параметры фотографий фиалок.
Пишите в комментариях обо всех местах в кодировке, которые вам показались узкими и спорными.
А пока вопросы, которые к сообществу относительно мест, которые уже внушают мне сомнения.
1. Форма цветка
Текущая кодировка формы цветка такая:
- f0, простая (анютка)
- f1, звезда
- f2, колокольчик
- f3, оса
- f4, ромашка
Когда перечисляются несколько разноплановых значений, желательно с меньшими номерами пускать более частые вариант. Анютка и звезда стоят на своих местах. А вот разумна ли дальше предлагаемая какова дальше последовательность:
- f2, колокольчик
- f3, оса
- f4, ромашка?
И нужно ли вообще включать "ромашку"?
Может быть лучше сделать так:
- f0, простая (анютка)
- f1, звезда
- f2, колокольчик
- f3, оса?
Или все же так:
- f0, простая (анютка)
- f1, звезда
- f2, оса
- f3, колокольчик?
2. Гамма
Гамма двуцветная и многоцветная - может быть их объединить вместе? Тогда вместо
- g0, химера
- g1, одноцветная
- g2, двуцветная
- g3, многоцветная
- g4, фэнтези
будет
- g0, химера
- g1, одноцветная
- g2, многоцветная
- g3, фэнтези?
Есть ли также смысл поменять химеру и фэнтези местами? Что лучше выглядит на нулевом месте - химера или фэнтези?
3. Пестролистность
Аналогичный вопрос относительно пестролистности [6]:
- p0, не пестролистная
- p1, пестролистная
- p2, кроновая
- p3, Томи Лоу
- p4, мозаичная (Лилиэн Джеррет)
В каком порядке должны кроновая, Томи Лоу и мозаичная пестролистность? Если пестролистность Томи Лоу встречается чаще, то может быть поставить ее перед кроновой пестролистностью?
Нужно ли добавлять еще какие-то экзотические варианты пестролистности?
4. Странные формулировки параметров
Некоторые формулировки не вполне устоялись среди фиалководок. Например, неровные края листвы кто как не называет:
- неровные
- волнистые
- гофрированные
- бахрома
- оборки
- рюши
- ...
В таких случаях я называл параметр каким-то подходящим словом, чтобы оно попало на незанятую букву латинского алфавита. С учетом того, что:
- у нас 17 параметров на 26 латинских букв
- некоторые английские буквы не имеют аналог для русских слов ("W","J"...)
корявость в некоторых терминах неизбежна.
Нужно учесть, что все термины технические и нет никакой необходимости помнить их. При работе с базой данной (пополнении или поиску по базе) все термины будут показаны в виде отдельных выпадающих меню. Достаточно будет последовательно пройтись по всем параметрам. При частом использовании базы параметр быстро запомнится, как запомнится и буква, связанная с ним.
Как думаете:
- перетерпим некоторые странные названия параметров
- или дадим им нормальные названия, но потеряем связь с понятной латинской буквой?