Как ИИ распознаёт, что на фотографии? Как он «видит» картинку

Задан 18 месяцев назад1.5к просмотров1 ответ

Загружаешь фото — и ИИ говорит, что на нём кот, машина или что там. Как он «видит» картинку? Для него же это просто файл. Очень интересно, как это работает внутри.

Игорь Михайлов 🐣 Птенец

спросил 18 месяцев назад

1 ответ

✓ Принятый ответ — помог автору

Ты прав: для компьютера картинка — это просто таблица чисел. Каждый пиксель — это числа яркости и цвета. ИИ не «видит» как мы, он работает с этими числами. Но как из чисел получается «это кот»?

Идея в том, что нейросеть учат распознавать признаки, слой за слоем, от простого к сложному:

Первые слои находят совсем простое: края, линии, пятна цвета.
Следующие складывают их в формы: углы, дуги, текстуры (например, узор шерсти).
Дальше — части объектов: глаз, ухо, нос, лапа.
Последние слои собирают это в целое: «есть усы, острые уши, мех, форма морды → это, скорее всего, кот».

Как она этому научилась: ей показали миллионы картинок с подписями («кот», «собака», «машина»). Сначала она ошибалась, веса подкручивались — и постепенно она сама вывела, какие сочетания признаков соответствуют чему.

Поэтому ИИ может ошибиться на необычном фото (странный ракурс, кот в костюме) — он опирается на привычные признаки из обучения. Никакого «понимания», что такое кот, у него нет — только узнавание закономерностей в числах.

Галина Попова 🐣 Птенец

18 месяцев назад

Ваш ответ

Войдите, чтобы ответить на вопрос.