Меню

Программа-робот для определения безымянных сортов

Нашли ошибку? Сообщите о ней: 1) Выделите ошибку мышкой 2) Нажмите CTRL+Enter. Подробнее...

Денис Никитин аватар

Есть возможность сделать программу-робот для автоматического определения безымянных сортов.

Любая начинающая фиалководка введет несколько признаков своего безымянного сорта (размер, цвет, махровость, пестролистность,....) и получит 10-20 фотографий сортов с тем же сочетанием признаков. Ей останется лишь подобрать самую похожую фотографию, на которой будет написано название сорта.

С помощью робота-опознавателя фиалководка может быстро опознать все безымянные сорта из своей коллекции:

Автоматический опознаватель

Зачем еще нужно автоматическое определение сортов

У робота-опознавателя есть и другие применения. Он поможет сделать шоу "Узнай меня" более динамичным (см. видеоролик с премьерой шоу "Узнай меня" Елены Григорьевой). 

Сейчас эксперты смотрят на фото безымянной фиалки и вытаскивают из памяти знакомые сорта фиалок, которые похожи на нее. Ищут по интернет фотографии похожих сортов и сравнивают, точно ли похожа или показалась.

Сила эксперта полностью зависит от того, как много сортов он знает и насколько у него хорошая память.

При этом в видеоролик с записью шоу мы не имеем права вставлять фотографии сортов с чужих сайтов, которые эксперты сочли похожими на фиалку с безымянным сортом. Видеоролики могут содержать только авторские материалы или материалы, для которых есть лицензионного соглашение. Из-за этого ограничения эксперт в видеозаписи вынужден словами рассказывать о похожем сорте вместо того, чтобы вставить в видеоролик его фото.

Текущий сценарий шоу "Узнай меня":

  • сильно зависит от памяти экспертов
  • их желания бегать по Интернет и проверять фото похожие сорта
  • не дает возможности вставлять в видеоролик фотографии сортов с чужих сайтов.

Робот-опознаватель освободит экспертов от поиска похожих сортов. Он подберет для данного сорта подберет 5-7 похожих сортов. А экспертам останется лишь подобрать среди них сорт, более всего похожий на опознаваемую фиалку.

База 5000 фотографий сортов

На нашем сайте в рубрике блога "Фото сортовых фиалок" опубликовано 1500 статей, в них около 5000 фотографий сортовых фиалок.

Мы можем совершенно свободно использовать в шоу эти фото и вставлять в видеоролик.

К сожалению, на сегодня эти 5000 фото можно искать в поиске по сайту только по названию сорта. Да и то, если автор при публикации сорта указал в поле "Описание фото" название сорта. Но на шоу "Узнай меня" приносят фиалки вообще без названия.

Для поиска по базе из 5000 фотографий каждая из них будет дополнительно описана по 10-20 параметрам:

  • размер (стандарт, миди, мини)
  • основной цвет бутона
  • фэнтези
  • наличие махры
  • наличие каймы
  • пестролистность
  • красная изнанка
  • заостренная форма листа
  • ...

Тогда можно будет ввести в программу параметры безымянной фиалки и через 1 секунду получить десяток фотографий сортов, которые обладают ровно такими же параметрами - размером, цветом, махрой и т.д.

Голосование списка похожих сортов

Дальше ведущая показывает безымянную фиалку и одновременно очередной вариант похожего сорта (его название не показывается). Эксперты с видеокамерами по очереди оценивают похожесть фотографий и обращают внимание на похожие и различающиеся детали. Хозяйка тоже высказывается, похоже фото на ее любимицу или нет. Выслушав мнения, зрительницы в зале голосуют, насколько похож очередной вариант на безымянную фиалку. Вариант получает средний бал за похожесть, от 1 до 5.

Так один за одни перебираются и голосуются все найденные 5-7 похожих вариантов.

Варианты сортируются начиная от вариантов с самыми большими баллами за похожесть в сторону менее похожих. В списке остаются только варианты с не менее 3 баллами за похожесть. Показываются их названия. Этот список считается результатом опознания безымянной фиалки.

Плюсы нового сценария

1. Легкость подготовки к шоу. Для одного опознания ведущая быстро найдет 5-10 подходящих фотографий сортов и опубликует их за несколько минут на телеканале.

2. Экономия времени экспертов. Они заранее не готовятся к шоу и работают только во время шоу.

3. Исключаются ситуации, когда экспертам бросают упрек, что они неправильно опознали сорт. В новом сценарии похожие фотографии подбирает программа. Эксперты только выбирают из них самые похожие сорта из представленных программой. При этом не имеют права ссылаться на еще более похожие сорта с фотографиями на чужих сайтах. А окончательный выбор делают зрительницы в зале. Как всегда в групповой работе никто личной ответственности ни за что не несет.

4. Опознание становится динамичным и красочным. В шоу появляется обилие фотографий, их можно свободно вставлять в видеоролик. При этом сохраняются реплики экспертов, рассказ владелицы о своей безымянной фиалки и т.д..

5. В будущем можно будет встроить программу поиска прямо в шоу. Тогда ведущая сможет прямо во время шоу искать и предлагать похожие сорта на голосование.

6. Эту же программу начинающие фиалководки смогут использовать на сайте для самостоятельного поиска похожих вариантов (см. аналогичный поиск фиалок на Violets.ru). Но если фиалководка не знает, как сравнивать фото фиалок, то сможет обратиться на шоу "Узнай меня", где сравнение сделают эксперты и зрители в зале.

7. Викторина. В шоу "Узнай меня" станет возможным проводить викторину со зрительницами. Ведущая берет случайный сорт из базы и программа ей выводит название этого сорта и еще названия 4-х похожих сортов. Ведущая просит угадать, какой сорт в списке 5-ти сортов соответствует предъявленному фото. Все голосуют. На следующий тур переходят только те, кто угадал названия в предыдущем туре. Владельцы веб-камер имеют право на одну ошибку. Так за 3-4 тура выявляется победитель, который угадал сорта во всех турах и ни разу не ошибся. Если викторина пойдет, то можно будет ее проводить отдельным шоу.

Обсуждение

Пожалуйста, напишите в комментариях, насколько нужен вам вообще робот-опознаватель (для опознания, для нового сценария,...).

Поделиться:  

Комментарии

Инна Адамова аватар

Робот-опознаватель - это же просто моя голубая мечта (махровая с обильным фэнтези).

Как раз сижу и пытаюсь понять, что же это у меня зацвело. Знаю, где брала, и там все подряд перебираю.... Пока результата нет.

А кто будет делать эту программу. Мы все? Совместными усилиями? Если да, то я готова оказать посильное содействие.

Денис Никитин аватар

Bogdanamama пишет:
"А кто будет делать эту программу. Мы все? Совместными усилиями?"

Да, делать будем все вместе.

Добровольцам нужно будет просмотреть 5000 фотографий и каждую описать по заранее выбранным параметрам:

  • название
  • размер розетки (стандарт/полумини/мини)
  • основной цвет бутона
  • махра
  • кайма
  • фэнтези
  • форма листа
  • изнанка листа
  • ...

На описание одной фотографии уходит примерно минута.

Когда у робота будет собрана база таких описаний, программист напишет программу-оболочку для поиска по базе. Получится робот-опознаватель, который состоит из базы и программы-оболочки для доступа к базе. Им воспользоваться сможет любая фиалководка 

На Violets.ru есть подобный поиск по признакам сорта, но там не очень удобно устроено для опознания:

  • неудобно задавать параметры поиска
  • результат выдается в виде ссылки на страницу, где может оказаться лишь текстовое описание сорта
  • в базе всего 400 сортов из которых многие с одним лишь текстовым описанием.

Bogdanamama пишет:
"Я готова оказать посильное содействие."

Спасибо за Ваше предложение. Именно с помощью таких добровольцев как Вы робот-опознаватель может стать реальностью.

Он будет качественно искать похожие сорта только если у него есть база параметров всех 5000 фотографий сортовых фиалок, опубликованных на сайте. Одному человеку нереально составить такую базу. Но если найдется 100 добровольцев, то каждый потратит всего лишь один час, за который не спеша опишет 50 сортов. И робот сможет искать по ней.

Но пока в этом сообщении мы не собираем добровольцев, а просто прикидываем, нужен ли вообще сообществу робот-опознаватель и разные способы его применения. Хотелось бы, чтобы робот-опознаватель можно было использовать как можно в более широких применениях:

  • опознание безымянных сортов по параметрам
  • поиск названия по неточному названию
  • подбор сортов по заданным параметрам для любования
  • в шоу "Узнай меня"
  • в викторине "Узнай меня"
  • ...

Каждый способ применения робота-опознавателя расширяет круг людей, заинтересованных в его запуске.

Шоу "Узнай меня"

Если Елена Григорьева будет морально готова перестраивать свое шоу на работу через робота-опознавателя, то шансы на скорейший запуск робота сильно увеличатся.

На шоу ОРТ "Жди меня" только часть случаев показывают по телевидению. Остальной поиск пропавших людей ведется через сайт телепередачи, там ведется база запросов на поиск потерянных людей.

У нас тоже в шоу "Узнай меня" опознают лишь некоторые тщательно подобранные случаи. А массовые опознания безымянных фиалок будут делаться через робота-опознавателя.

Наталья Шаклеина аватар

Идея очень замечательная. Думаю, что эффект будет более положительный, в смысле найти настоящее имя безымяшке.

Хотя с другой стороны, когда каждый желающий участвует, предполагает, высказывает... общается... Это тоже очень интересно, хотя и к общему "знаменателю" приходят не всегда..

Елена Летова аватар

Замечательная идея! Частенько смотришь на фото и думаешь: знакомый же сорт, а названия никак не вспомнить, а здесь типа шпаргалки - остается только отличия и сходство определить.

Таня Федькина аватар

Мне тоже идея очень понравилась, нам новичкам она необходима....Буду очень рада обратиться к роботу за помощью. Если потребуется моя помощь в наборе описаний фиалочек, помогу с удовольствием. Всех любителей и профессионалов поздравляю с наступающим Новым годом!Подмигивание

Ирина Пискунова аватар

Идея хорошая, но как быть с теми фиалками, которые, например, в процессе своей жизни по каким-либо причинам будут видоизменяться, "мутировать" ?.. Тяжело будет такую фиалку "опознать", тем более новичку! Но базу данных создать надо, согласна.

Денис Никитин аватар

Ирина Пискунова пишет:
"но как быть с теми фиалками, которые, например, в процессе своей жизни по каким-либо причинам будут видоизменяться, "мутировать" ?.. Тяжело будет такую фиалку "опознать", тем более новичку!"

Автоматическое опознание не устанавливает точный сорт, а лишь предлагает варианты сортов, на которые похожа безымянная фиалки. Если условия содержания фиалки изменились или фиалка процвела в очередной раз по другому, то и результаты автоматического опознания тоже поменяются.

Это вполне нормально. Фиалка заведомо известного сорта тоже может за время своей жизни перестать цвести по сорту, спортировать. Как заметила Елена Летова, иной раз из черенков сортовой фиалки можно вырастить 3 фиалки других разных сортов, да таких, что:

  • селекционеры этих трех сортов на очном опознании поклянутся на Библии, что это именно их сорта
  • селекционер фиалки-мамы не признает ни одну фиалку-дочку за свой сорт.

Не нужно ждать от автоматического опознания точного названия сорта. Если принести на опознание фиалку сорта, которого у робота нет в базе, то робот при всем своем желании не назовет этот сорт, раз имени этого сорта нет в базе.

Ирина Пискунова пишет:
"Но базу данных создать надо, согласна."

Да, за последние годы на нашем сайте накоплено достаточно фотографий, чтобы перекрыть 80% сортов фиалок, гуляющих по коллекциям. Самое время подумывать, как сортировать и описывать все фото, чтобы к ним был быстрый доступ по признакам фиалки.

К сожалению, через поиск по сайту можно найти фото только если знаешь его название, что для безымянных фиалок бесполезно.

Felix аватар

Идея с базой данных очень хорошая. Я давно увлекаюсь фиалками, сортов не много (ок. 10-11), стараюсь держать дубликаты, поэтому их уже получается достаточно много  ( если не брать в счет другие цветы в доме). Я все время под ударом - "или ты или твои цветы". :) Тем не менее, я чувствую, что фиалка  - мой цветок,  о они мне отплачивают красивым цветением. Сама программа поиска по базе данных достаточно простая. Я бы с удовольствием написал и базу данных и программу к ней, но к сожалению у меня на это просто нет времени. Но если понадобится консультация или мое видение готового продукта - всегда отвечу.

Думаю, что для начала необходимо создать четкий классификатор по которому будет строится идентификатор отдельного сорта. Если это, скажем порядок свойств- цвет - лист-махра  и т д., то, например, идентификатор равный 411100 в данном ряде двухзначных цифр будет означать  01- бордо 11 - фестончатый, 00- немахровый. Короче говоря, нужно создать полные справочники, а затем, на  основе созданных списков ( идентификтор - название - указатель на фото в базе)  переименовывать файлы фотографий, например F411100.jpg Подмигивание

Денис Никитин аватар

Прошу всех не отвечать на последний комментарий только потому что он последний.

Если хотите прокомментировать статью, поднимитесь наверх, найдите в конце статьи ссылку "Ответить" и нажмите на нее.

Ирина Тучкова аватар

Обеими руками за эту программу! Готова помочь. Вопрос: для описания фиалки нужно будет пользоваться авторским описанием, составлять свое или комбинировать?

Денис Никитин аватар

Ирина Тучкова пишет:
"Обеими руками за эту программу! Готова помочь"

Спасибо за предложенную помощь. Судя по уже имеющимся предложениям, нам удастся собрать нужное количество добровольцев.

Ирина Тучкова пишет:
"для описания фиалки нужно будет пользоваться авторским описанием, составлять свое или комбинировать?"

У нас поиск опирается на материал в рубрике блога "Фото сортовых фиалках". Так сложилось, что там редко у каких фотографий сортовых фиалок есть текстовые описания. Воспользоваться описанием автора фотографии или скомбинировать его в большинстве случаев быстро не получится. Придется идти в Интернет и искать описание сорта. Это увеличит количество работы по добавлению одной фотографии в базу в несколько раз.

Более практичен вариант, когда доброволец составляет описание сорта, глядя на фотографию фиалки. Если какие-то детали не видны на фото (красная изнанка,...), то доброволец пропускает их в описании.

Но отдельного описания для людей делать нет нужды. Вполне достаточно одного описания для робота, из которого он всегда сможет сделать описание для людей.

Описание для робота это небольшая форма, которую добровольцы будут заполнять в каждой статье в рубрике блога "Фото сортовых фиалках". Эта форма мало чем отличается от формы поиска по признакам.

Описание сайта Fialkovod.ru

В качестве первого примера формы для описания возьмем форму поиска по признакам, которая используется на сайте Fialkovod.ru (в левой колонке).

Глядя на какую-то фотографию сортовой фиалки добровольцу нужно будет заполнить примерно такую форму:

Название (если известно)

Селекционер (если известен)

...

Аналогичная форма может использоваться для поиска по параметрам. Искать можно будет по любым параметрам, которые присутствуют в форме по сбору описания.

Рядом с найденной фотографией робот может напечатать признаки, которые были введены при описании фиалки (махровая, пестролистная, цвет такой-то и т.д.).

Описание Ксении Дударевой

Еще есть статья Ксении Дударевой "Как составить описание узамбарской фиалки?". В ней перечислены практически все признаки, которые встречаются при описании фиалок:

  • Простые
  • Простые-полумахровые
  • Полумахровые
  • Полумахровые-махровые
  • Махровые
  • Бархатные
  • Крупные (> 2,5/ 4/ 4,5/ 5 см)
  • Чашевидные
  • Волнистые
  • Гофрированные
  • Анютка
  • Звезда
  • Колокольчик
  • Оса
  • Глазок
  • Кольцо
  • Напыление
  • Разводы (пятна)
  • Тени
  • Сеточка
  • Фэнтезийные пятна
  • Фэнтезийные штрихи
  • Фэнтезийные мазки
  • Верхние лепестки
  • Лучи
  • Фэнтезийные лучи
  • Пальчики
  • Фэнтезийные пальчики
  • Внутренняя кайма
  • Внутренняя кайма набрызгом
  • Внутренняя фэнтезийная кайма
  • Кайма
  • Кайма набрызгом
  • Фэнтезийная кайма
  • Кончики лепестков
  • Длинные цветоносы
  • Крепкие цветоносы
  • Окаймляющая пестролитность
  • Мозаичная пестролистность
  • Кроновая пестролистность
  • Химерная пестролистность
  • Светло-зелёные
  • Средне-зелёные
  • Тёмно-зелёные
  • Белый
  • Кремовый
  • Желтый
  • Розовый
  • Гёл-листья
  • Плоские гёл-листья
  • Овальные
  • Округлые
  • Продолговатые
  • Сердцевидные
  • Заостренные
  • Стёганые
  • Пупырчатые
  • Глянцевые
  • Сильно опушенные
  • Волнистые
  • Гофрированные
  • Ложковидные
  • Обратно-ложковидные
  • Падубовидные
  • Городчатые
  • Пильчатые
  • "Арбузные прожилки"
  • Красная изнанка
  • С прилистниками
  • Миниатюра (7..15см / 1,2...2,5см)
  • Полуминиатюра (15..20см / 2,5…4см)
  • Компактный стандарт (20..30 см / 4…4,5см)
  • Стандарт (30..40 см / 4,5…5см)
  • Крупный стандарт (40..60 см / > 5см)

Если описывать фиалку по таким признакам, то робот может из такого описания сгенерировать полноценное описание фиалки. Причем как на русском и украинском, так и на английском, китайском и любых других языках.

Описание фотографии Fialki.ru

Наша форма сбора информации будет нечто средним между спартанской формой сайта Fialkovod.ru и слишком подробной формой Ксении Дударевой.

Удачный выбор параметров для описания и для поиска чрезвычайно важен. После начала сбора данных мы уже не сможем изменить формат сбора информации.

Когда дело дойдет до непосредственного сбора информации, наше сообщество обсудит и проголосует подходящий набор параметров для описания.

Алена Новикова аватар

Идея отличная!Тем более, каждый по мере сил может принять участие, присылая фотографии с более подробным описанием сорта, ведь гораздо проще описывать сорта из собственной коллекции, чем просто по фото и литературе.

Денис Никитин аватар

Алена Новикова пишет:
"Тем более, каждый по мере сил может принять участие, присылая фотографии с более подробным описанием сорта"

Сейчас стоим между двумя стульями и решаем, на каком из них сидеть.

Есть 2 способа создания базы:

  • тот, кто публикует фото, описывает его по 15-20 параметрам
  • добавляют фото одни, описывают их другие (добровольцы).

Модель пополнения базы, когда публикующий фото описывает его, используется в Фотоконкурс Fialki.ru. Там все участницы должны будут качественно снимать фотографию фиалок на сером фоне и тщательно описывать ее. Все фотографии с фотоконкурса будут использованы в поиске по признакам. В этой модели можно готовить очень качественную базу, но на сбор стартовой базы может уйти 1-2 года.

Модель разделения создания базы между публикаторами фотографий и описывателями:

  • снижает нагрузку на публикаторов
  • приток фотографий в базу будет в несколько раз больше, чем на фотоконкурсе
  • позволяет сразу воспользоваться уже существующими фотографиями.

Выбор

Какую из двух моделей сбора данных предпочесть - это большой вопрос для обдумывания.

Дело в том, что у нас есть еще одна аналогичная пара стульев, между которым тоже надо делать выбор.

В интернет-сериале "Клиника" специально подобранные опытные фиалководки будут определять болезнь хорошо сфотографированных фиалочек. Каждая болезнь будет описана по 50 параметрам. Постепенно будет создана база историй болезней и поставленных диагнозов. На основе этой базы можно будет запустить робота "Доктора Хауса". Если ему задать признаки болезни, то он выдаст похожие истории болезни с фотографиями и диагнозами. Владелице больной фиалочки останется лишь подобрать истории болезни, наиболее похожие на случай с ее фиалкой.

Но у нас на форуме "Уход за фиалками" уже собрано около 1500 обсуждений болезней. Многие из них с фотографиями. А с конца августа любое сообщение на форуме обязательно содержит фотографию.

Т.е. вместо того, чтобы с нуля создавать базу историй болезни, добровольцы могут описать 500-700 имеющихся историй болезней с фотографиями. Составление для базы одного описания болезни занимает ту же 1 минуту. И робот "Доктор Хаус" заработает не через несколько лет, когда наберется база историй болезни, а весьма быстро.

Взаимосвязь

Выбор модели сбора данных для поиска фиалок сильно связан с моделью для сбора данных историй болезни. Решение нужно принимать одновременно, хотя исполнять, возможно, в разное время.

Если решим собирать данные для робота-опознавателя через добровольцев, то будет создан механизм для первоначального создания базы о сортовых фиалках и ее постоянного пополнения. Но этот же механизм легко трансформируется для сбора данных об историй болезни и ее пополнения:

  • добровольцы-описыватели могут быть одни и те же
  • программа для ввода описания одна и та же
  • программа для выдачи результатов поиска (сорта или болезни) одна и та же.

Универсальный робот-опознаватель

Раз есть 2 разных вида информации (сорта и болезни), которые обслуживаются одним механизмом, то наверняка есть и другие виды информации, которые можно обслуживать тем же механизмом.

И удобнее сначала найти всевозможные виды информации, которые можно подогнать под этот механизм, а затем сделать единый механизм.

Механизм-опознаватель, о котором идет речь, позволяет по признакам опознавать все что угодно. На выходе он выдает похожие фотографии и название. Мы его можем навесить на любую информацию, собираемую на сайте.

Если кому-то голову придут еще какие применения универсального робота-опознавателя кроме опознания безымяшек и болезней, пишите.

Для вдохновения воображения. Например универсальный робот может подбирать подходящий стеллаж из рубрики "Стеллажи". Их там пока немного, около сотни. Но если в рубрике будет хотя бы с 500 стеллажей, просмотреть их все будет уже невозможно.

Кристина Казбаева аватар

Супер!Супер! Какая хорошая идея! Я так же смогу помочь с описанием, если надоЗасмущалась. Такую вещь упустить нельзя!