Опубликовано Fialki.ru (https://www.fialki.ru)

Главная > Формат базы данных фотографий сайта

Денис Никитин аватар

Формат базы данных фотографий сайта

Автор: Денис Никитин, 13 января, 2011 - 16:29   |   Тема на форуме   | Форумы:  Форум авторов
Forums: 
Форум авторов [1]

Начинаем подготовку к внесению в общую базу данных всех фотографий фиалок, опубликованных на Fialki.ru.

Сейчас к ним есть доступ только через поиск по сайту [2] да и то только если известно название. В единой базе каждая фотография будет описана по многим параметрам. Это позволит использовать базу самыми разными способами:.

  • для любования (например, посмотреть синие махровые пестролистники)
  • для составления каталога (авторы блогов увидят все опубликованные сорта в своем личном каталоге)
  • для поиска сортов по названию, даже написанному с ошибками
  • для самостоятельного опознания роботом-опознавателем [3]
  • для программы подбора пар при селекции фиалок [4]
  • ...

Описание для базы фиалок

Ввод параметров фиалки

Прошлой весной из многих десятков параметров, описывающих фиалки [5], сообщество выбрало 17 самых интересных параметров.

При работе с базой данных фиалководка вводит те параметры, в которых уверена. Добровольцы, пополняющие базу, вводят данные относительно очередной фотографии фиалки на сайте. Владелица безымянной фиалки вводит данные о фиалке, которую держит перед собой. Если какой-то параметр недоступен, он пропускается.

Каждый вариант параметра помечен специальным кодом из латинской буквы и 1-2 цифр:

Бутон
Листва Розетка

После ввода известных параметров фиалки нажимается кнопка:

  • , если добавляется фото в базу
  • , если подыскиваются похожие сорта.

Из указанных признаков для фиалки составляется код. Он выглядит примерно так:

m1c33k2f3g2n0d7p2i1t1h0s0v1a0u2r18o24

При добавлении сорта в базу сохраняется код сорта и адрес фото. При поиске похожих фотографий фиалководка пересылается на страницу:

Fialki.ru/sorta?m1c33k2f3g2n0d7p2i1t1h0s0v1a0u2r18o24

где выдаются 20-50 фотографий сортов, у которых код чуть-чуть отличается от заданного в поиске. В начале поиска похожих фиалок будут выданы сорта с практически идентичным кодом.

Код сорта

Код сорта это не нечто неподвижное и вечное. У разных образцов сорта коды будут неизбежно немого отличаться ("плавать"). Но в целом любые образцы сорта будут иметь довольно похожий код, отличающиеся всего лишь в 5-10% параметров. А разные сорта будут отличаться по коду на 20% и более процентов. Это позволяет элементарно искать по базе похожие сорта.

Запоминать кодировку нет обязательно. Код составляется автоматически в зависимости от выбранных вариантов из выпадающих меня. Но может случится такое, что на каком-то форуме вы увидели фиалку на опознание. Если помните некоторые буквы кода, то можете прямо на память ответить:

"Посмотрите варианты на Fialki.ru/sorta?m2f0p1k0c2h2"

что приведет к поиску фиалок, похожих на махровую зеленую анютку-пестролистник с холмистыми краями листьев.

Но если зайдете на страницу робота-опознавателя и введете больше параметров, то поиск будет более тщательный и просеивать нужно будет меньше вариантов.

Цвет

Изначально цвет принимает в коде 6 значений:

  • c0, белый
  • c1, желтый
  • c2, зеленый
  • c3, синий
  • c4, фиолетовый
  • c5, вишневый

При необходимости для уточнения цвета можно к значению цвета добавить вторую цифру, означающую степень темноты цвета:

  • 0, светлый вариант цвета
  • 1, средне-темный вариант цвета
  • 2 темный вариант цвета

Например:

  • с32, темно-синий
  • c50, розовый

Всего для наших фиалковых нужд достаточно 12 стандартных цветов:

12 стандартных цветов

При определенной тренировке может различать даже на глаз разницу на фотографиях фиалок между синим/фиолетовым/вишневым и их оттенками. Особенно если рядом будет таблица стандартных цветов в качестве эталона.

Обсуждение

Прежде чем передавать формат кодировки программисту, нужно обсудить его. Возможно, что-то в данной будет неудобно заполнять параметры фотографий фиалок.

Пишите в комментариях обо всех местах в кодировке, которые вам показались узкими и спорными.

А пока вопросы, которые к сообществу относительно мест, которые уже внушают мне сомнения.

1. Форма цветка

    Текущая кодировка формы цветка такая:

    • f0, простая (анютка)
    • f1, звезда
    • f2, колокольчик
    • f3, оса
    • f4, ромашка

    Когда перечисляются несколько разноплановых значений, желательно с меньшими номерами пускать более частые вариант. Анютка и звезда стоят на своих местах. А вот разумна ли дальше предлагаемая какова дальше последовательность:

    • f2, колокольчик
    • f3, оса
    • f4, ромашка?

    И нужно ли вообще включать "ромашку"?

    Может быть лучше сделать так:

    • f0, простая (анютка)
    • f1, звезда
    • f2, колокольчик
    • f3, оса?

    Или все же так:

    • f0, простая (анютка)
    • f1, звезда
    • f2, оса
    • f3, колокольчик?

    2. Гамма

    Гамма двуцветная и многоцветная - может быть их объединить вместе? Тогда вместо

    • g0, химера
    • g1, одноцветная
    • g2, двуцветная
    • g3, многоцветная
    • g4, фэнтези

    будет

    • g0, химера
    • g1, одноцветная
    • g2, многоцветная
    • g3, фэнтези?

    Есть ли также смысл поменять химеру и фэнтези местами? Что лучше выглядит на нулевом месте - химера или фэнтези?

    3. Пестролистность

    Аналогичный вопрос относительно пестролистности [6]:

    • p0, не пестролистная
    • p1, пестролистная
    • p2, кроновая
    • p3, Томи Лоу
    • p4, мозаичная (Лилиэн Джеррет)

    В каком порядке должны кроновая, Томи Лоу и мозаичная пестролистность? Если пестролистность Томи Лоу встречается чаще, то может быть поставить ее перед кроновой пестролистностью?

    Нужно ли добавлять еще какие-то экзотические варианты пестролистности?

    4. Странные формулировки параметров

    Некоторые формулировки не вполне устоялись среди фиалководок. Например, неровные края листвы кто как не называет:

    • неровные
    • волнистые
    • гофрированные
    • бахрома
    • оборки
    • рюши
    • ...

    В таких случаях я называл параметр каким-то подходящим словом, чтобы оно попало на незанятую букву латинского алфавита. С учетом того, что:

    • у нас 17 параметров на 26 латинских букв
    • некоторые английские буквы не имеют аналог для русских слов ("W","J"...) 

    корявость в некоторых терминах неизбежна.

    Нужно учесть, что все термины технические и нет никакой необходимости помнить их. При работе с базой данной (пополнении или поиску по базе) все термины будут показаны в виде отдельных выпадающих меню. Достаточно будет последовательно пройтись по всем параметрам. При частом использовании базы параметр быстро запомнится, как запомнится и буква, связанная с ним.

    Как думаете:

    • перетерпим некоторые странные названия параметров
    • или дадим им нормальные названия, но потеряем связь с понятной латинской буквой?

    Источник (modified on 20.01.2011 - 15:09): https://www.fialki.ru/node/7264

    Ссылки
    [1] https://www.fialki.ru/forum/avtor
    [2] https://www.fialki.ru/poisk
    [3] http://www.fialki.ru/node/7210
    [4] http://www.fialki.ru/node/5726
    [5] http://www.senpolia.org.ua/article1.php
    [6] http://www.violet-slava.ru/statya_10.htm