← Все вопросы

Как ИИ распознаёт, что на фотографии? Как он «видит» картинку

Задан 18 месяцев назад1.5к просмотров1 ответ
8

Загружаешь фото — и ИИ говорит, что на нём кот, машина или что там. Как он «видит» картинку? Для него же это просто файл. Очень интересно, как это работает внутри.

1 ответ

11
✓ Принятый ответ — помог автору

Ты прав: для компьютера картинка — это просто таблица чисел. Каждый пиксель — это числа яркости и цвета. ИИ не «видит» как мы, он работает с этими числами. Но как из чисел получается «это кот»?

Идея в том, что нейросеть учат распознавать признаки, слой за слоем, от простого к сложному:

  1. Первые слои находят совсем простое: края, линии, пятна цвета.
  2. Следующие складывают их в формы: углы, дуги, текстуры (например, узор шерсти).
  3. Дальше — части объектов: глаз, ухо, нос, лапа.
  4. Последние слои собирают это в целое: «есть усы, острые уши, мех, форма морды → это, скорее всего, кот».

Как она этому научилась: ей показали миллионы картинок с подписями («кот», «собака», «машина»). Сначала она ошибалась, веса подкручивались — и постепенно она сама вывела, какие сочетания признаков соответствуют чему.

Поэтому ИИ может ошибиться на необычном фото (странный ракурс, кот в костюме) — он опирается на привычные признаки из обучения. Никакого «понимания», что такое кот, у него нет — только узнавание закономерностей в числах.

Ваш ответ

Войдите, чтобы ответить на вопрос.