Текущее время: Вс 28 апр 2024 13:27

Часовой пояс: UTC + 4 часа




Начать новую тему Ответить на тему  [ Сообщений: 108 ]  На страницу Пред.  1, 2, 3, 4
Автор Сообщение
 Сообщение Вс 13 ноя 2011 16:12
Профиль  
#105d99
Аватара пользователя
Сообщения: 15233
Откуда: Москва, сектор бетонных домов
Зарегистрирован: Пн 20 фев 2006 3:56
Шаман писал(а):
И с этой задачей вполне может справится даже хилая видеокарта

Да прям. Вон, лучшие умы бьются над распознаванием образов, а у тебя уже хилая видеокарта со всем справилась. До сих пор, даже такая узкоспециализированная задача, как распознавание капчи, не решена, что уж говорит о "вообще". Зрительный анализатор работает куда сложнее - вспомните всякие иллюзии, например, когда кажется, что статическая картинка двигается.


 Сообщение Вс 13 ноя 2011 16:30
Профиль  
Механоид 5 поколения
Аватара пользователя
Сообщения: 4676
Зарегистрирован: Вс 29 авг 2010 18:18
Как это не решена, а индусский кластерный метод?

_________________
GAMES ARE ONLY FUN IF THEY HURT A LITTLE BIT


 Сообщение Вс 13 ноя 2011 18:28
Профиль  
Разработчик идей
Аватара пользователя
Сообщения: 4577
Откуда: Минск, Беларусь
Зарегистрирован: Ср 14 ноя 2007 19:00
Pek писал(а):
Как это не решена, а индусский кластерный метод?

Поподробнее, плиз?

Razum писал(а):
Да прям.
Смотря какой стадией имэдж процессинга ограничится. Если моделировать сетчатку, то алгоритм простой: берём девять соседних пикселов, суммируем радиальные 8 пикселов, результат делим на 8 и вычитаем из него значение центрального пиксела. Берём модуль. Так происходит выделение контуров на сетчатке - "центр минус периферия". Выделение линий тоже не особо тяжёлая задача - к полученной карте контуров применяется паттерн:
[*-1][*-1][*-1]
[*+2][*+2][*+2]
[*-1][*-1][*-1]
Такое паттерн позволяет выделять горизонтально-ориентированные линии. Если этот паттерн поворачивать на некоторый угол, то будут выделены линии разных ориентаций. В мозге мартышки колонка подобным образом ориентированных нейронов имеет градацию в 10 градусов.
Пока что видюха справляется, не так ли?
Это, конечно, лишь некоторые выборочные стадии имэдж-процессинговых зон мозга - те, что хорошо изучены и с которыми я с интересом знакомился, пытаясь понять принцип распознавания образов.
К слову, такой паттерн позволяет выделять углы (или края линий):
[*0][*0][*0]
[*-2][*+1][*+1]
[*0][*0][*0]

Лично мои "подозрения" на предмет того, зачем из картинки выделяются именно линии, и почему мы способны распознать предмет с любой точки обзора и расстояния - параллельные линии в объекте так и остаюся паралельными вне зависимости от точки обзора - повертите картонку в воздухе. К тому же, отношения длин параллельных линий остаются константными, как и отношения длин перепендикуляров между ними (если линий больше 2-х). Другими словами, мозг использует информацию не в абсолютном виде (абсолютная освещенность пиксела, длина линии на сетчатке), а в относительном (разница освещённости между пикселом и его окружением, отношение длин линий). Я считаю это моим большим открытием мозговой филлософии. :teeth:

_________________
Сообщество креативных механоидов:
aim-fans.ru


 Сообщение Вс 13 ноя 2011 21:29
Профиль  
Механоид 5 поколения
Аватара пользователя
Сообщения: 4676
Зарегистрирован: Вс 29 авг 2010 18:18
Цитата:
Поподробнее, плиз?

Бот натыкается на каптчу, отсылает ее одному из тысячи индусов, которые сидят в большом помещении с компами и занимаются тем, что набирают непрерывно приходящие от миллионов ботов каптчи.

_________________
GAMES ARE ONLY FUN IF THEY HURT A LITTLE BIT


 Сообщение Вс 13 ноя 2011 23:36
Профиль  
Разработчик идей
Аватара пользователя
Сообщения: 4577
Откуда: Минск, Беларусь
Зарегистрирован: Ср 14 ноя 2007 19:00
А, понятно.

_________________
Сообщество креативных механоидов:
aim-fans.ru


 Сообщение Пн 14 ноя 2011 0:29
Профиль  
#105d99
Аватара пользователя
Сообщения: 15233
Откуда: Москва, сектор бетонных домов
Зарегистрирован: Пн 20 фев 2006 3:56
Минуточку, а что, разве светочувствиельные элементы глаза расположены квадратно-гнездовым способом? Что-то я немного сомневаюсь.

Добавлено спустя 3 минуты 54 секунды:

Нет, ну хорошо, контуры-линии ты выделил, а дальше-то что с ними делать?


 Сообщение Пн 14 ноя 2011 1:09
Профиль  
Разработчик идей
Аватара пользователя
Сообщения: 4577
Откуда: Минск, Беларусь
Зарегистрирован: Ср 14 ноя 2007 19:00
Razum писал(а):
Минуточку, а что, разве светочувствиельные элементы глаза расположены квадратно-гнездовым способом?
Они понатыканы упиханно-хаотически (а чего ещё от природы ожидать?). Плюс в центре кучность больше, а по краям сетчатки рецепторов меньше. Рецепторные зоны нейронов, на которые пупочки шлют сигнал, в реале выглядят как два круга, один внутри другого - один возбуждает нейрон, другой гасит. Однако "квадратно-гнездовой способ" принципиально ничем не отличается, но компьютер-френдли. В этом случае паттерновые аналоги рецпторных зон выглядят так:
[-][-][-]
[-][+][-]
[-][-][-]
И так:
[+][+][+]
[+][-][+]
[+][+][+]
Т.е. в одном варианте окружающие пупочки давят нейрон, а центральные - возбуждают. Во втором варианте наоборот. Затем оба типа нейронов сливают результат в третий, аксон которого уже идёт из глаза в мозг. Упрощённо говоря, разумеется, бо механика там посложнее.
Razum писал(а):
Нет, ну хорошо, контуры-линии ты выделил, а дальше-то что с ними делать?
Есть два пути: убить макаку пиханием миллиарда иголок ей в мозг, либо почесать репу в приступе фаллософии. За неимением макаки я выбрал второй вариант:
Шаман писал(а):
Лично мои "подозрения" на предмет того, зачем из картинки выделяются именно линии, и почему мы способны распознать предмет с любой точки обзора и расстояния - параллельные линии в объекте так и остаюся паралельными вне зависимости от точки обзора - повертите картонку в воздухе. К тому же, отношения длин параллельных линий остаются константными, как и отношения длин перепендикуляров между ними (если линий больше 2-х). Другими словами, мозг использует информацию не в абсолютном виде (абсолютная освещенность пиксела, длина линии на сетчатке), а в относительном (разница освещённости между пикселом и его окружением, отношение длин линий). Я считаю это моим большим открытием мозговой филлософии.

_________________
Сообщество креативных механоидов:
aim-fans.ru


 Сообщение Пн 14 ноя 2011 1:58
Профиль  
#105d99
Аватара пользователя
Сообщения: 15233
Откуда: Москва, сектор бетонных домов
Зарегистрирован: Пн 20 фев 2006 3:56
Второй вариант лично мне ничего не объясняет.


 Сообщение Пн 14 ноя 2011 2:23
Профиль  
Механоид 5 поколения
Аватара пользователя
Сообщения: 4676
Зарегистрирован: Вс 29 авг 2010 18:18
Более того, он еще и неправильный.
Шаман забыл про перспективу.

_________________
GAMES ARE ONLY FUN IF THEY HURT A LITTLE BIT


 Сообщение Пн 14 ноя 2011 3:15
Профиль  
Разработчик идей
Аватара пользователя
Сообщения: 4577
Откуда: Минск, Беларусь
Зарегистрирован: Ср 14 ноя 2007 19:00
Не забыл, а забил. Без учёта перспективных искажений работать должно. А где перспективой пренебречь низзя, в ход идут прочие признаки. Я не утверждаю, что простым соотношением линий можно описать и распознать объект. Но, ИМХО, это один из основных способов. Возможно, благодаря бинокулярности автоматом проводится некоторая трансформация линий для корректировки погрешности, вносимой перспективой, но в такие дебри я не лез.

_________________
Сообщество креативных механоидов:
aim-fans.ru


 Сообщение Пн 14 ноя 2011 3:40
Профиль  
Механоид 5 поколения
Аватара пользователя
Сообщения: 4676
Зарегистрирован: Вс 29 авг 2010 18:18
Не, бинокулярность не влияет на визуальную гностику, иначе все рыбоньки очень бы мучались.

С линиями все не так просто, даже если забить на перспективу. Ты, увидев перечеркнутый много раз логотип эппл все равно поймешь, что это яблоко. А как комп этому научить?

_________________
GAMES ARE ONLY FUN IF THEY HURT A LITTLE BIT


 Сообщение Пн 14 ноя 2011 4:03
Профиль  
Разработчик идей
Аватара пользователя
Сообщения: 4577
Откуда: Минск, Беларусь
Зарегистрирован: Ср 14 ноя 2007 19:00
А кто сказал, что будет легко? :teeth:
Почему перечёркнутый много раз логотип эппл будет распознан как яблоко? Потому что это "яблоко" плюс "чёрточки". Добавочная информация никак не исключает присутствия яблока. Т.е. будет распознано и яблоко, и логотип эппл.
Другими словами, визуальный анализатор выдаёт набор всего того, что есть на картинке, и из этого набора элементов выборочные группируются как сложные образы. Подчёркиваю: происходит выборка, а не совместное восприятие. Если некоторые элементы часто встречаются в определённых комбинациях, они запоминаются как образы. Есть и более простой и древний способ - те элементы, что двигаются совместно, есть один предмет. Разумеется, это не применимо к статичным картинкам.

_________________
Сообщество креативных механоидов:
aim-fans.ru


 Сообщение Пн 14 ноя 2011 4:08
Профиль  
Механоид 5 поколения
Аватара пользователя
Сообщения: 4676
Зарегистрирован: Вс 29 авг 2010 18:18
Яблоко-то тоже черточками нарисовато. Т.е. будут распознаны черточки.
(Уложите меня спать, заберите у меня ангст.)

_________________
GAMES ARE ONLY FUN IF THEY HURT A LITTLE BIT


 Сообщение Пн 14 ноя 2011 4:37
Профиль  
Разработчик идей
Аватара пользователя
Сообщения: 4577
Откуда: Минск, Беларусь
Зарегистрирован: Ср 14 ноя 2007 19:00
И некоторые из этих чёрточек имеют взаимопропорции, как в образе яблока. Иди спать.

_________________
Сообщество креативных механоидов:
aim-fans.ru


 Сообщение Пн 14 ноя 2011 4:46
Профиль  
Механоид 5 поколения
Аватара пользователя
Сообщения: 4676
Зарегистрирован: Вс 29 авг 2010 18:18
А некоторые имеют взаимопропорции, как крестики и нолики. Почему комп решит, что это черточки и яблоко, а не черточки, крестики и нолики?
Я достал из заначки виски.

_________________
GAMES ARE ONLY FUN IF THEY HURT A LITTLE BIT


 Сообщение Пн 14 ноя 2011 5:20
Профиль  
Разработчик идей
Аватара пользователя
Сообщения: 4577
Откуда: Минск, Беларусь
Зарегистрирован: Ср 14 ноя 2007 19:00
Он увидит все возможные варианты. Если из набора чёрточек можно сложить "крестики и нолики", то они тоже будут присутствовать на выходах наравне с яблоком и эмблемой эппла.
Однако не все варианты будут иметь разные приоритеты - наиболее полные по всем признакам образы будут восприняты в первую очередь ("бросаться в глаза"), а спрятанные проявятся при вглядывании в картину путём подавления элементов приоритетных образов (перераспределение внимания).
Плюс ещё зависимость от контекста (т.е. сторонней инфы), желаний и предубеждённости, которые могут менять приоритеты выделяемых образов.

_________________
Сообщество креативных механоидов:
aim-fans.ru


 Сообщение Ср 11 июл 2012 12:22
Профиль  
Активный участник
Аватара пользователя
Сообщения: 68
Зарегистрирован: Ср 9 май 2012 21:47
А продалжение сюжета будет , я очень жду :god: :cry:


 Сообщение Пт 20 июл 2012 17:25
Профиль  
Новичок
Аватара пользователя
Сообщения: 11
Откуда: украина
Зарегистрирован: Чт 5 июл 2012 21:52
2 rodion
не ты один, ждёшь.


Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 108 ]  На страницу Пред.  1, 2, 3, 4

Часовой пояс: UTC + 4 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: Semrush [Bot] и гости: 59


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB