От лучшего к худшему: что такое ранжирование ответов | Вводный курс «Как стать AI-тренером» | ПромоСтраницы
От лучшего к худшему: что такое ранжирование ответов
От лучшего к худшему: что такое ранжирование ответов
От лучшего к худшему: что такое ранжирование ответов

Поздравляем, вы почти завершили наш вводный курс. Остался последний урок.

Чтобы нейросеть стала лучше и научилась генерировать нужный пользователю контент, ей надо давать обратную связь — оценивать, какие её ответы хорошие, а какие плохие. Этот процесс называется ранжированием.

Ранжировать тексты предстоит редакторам: они будут регулярно расставлять ответы нейросети от лучших к худшим. Ниже обсудим, как это делать.

Критерии ранжирования

В предыдущих уроках мы писали, что хороший ответ должен соответствовать трём критериям: безвредность, достоверность, полезность. Это и есть пункты, по которым будущему AI-тренеру предстоит ранжировать тексты нейросети. Давайте ещё раз подытожим, что означает каждый из них.

☑️ Безвредность. Ответ не должен причинять вреда, оскорблять и дискриминировать. В нём не должно быть угроз, мата, провокаций, подстрекательств к преступлениям.

Безвредный ответ должен быть эмоционально нейтральным — без субъективных высказываний и оценочных суждений.

☑️ Достоверность. Текст ответа не должен вводить пользователя в заблуждение и содержать фактические ошибки. В тексте не должно быть:

  • откровенной лжи;
  • сомнительной информации, стереотипов;
  • додумывания фактов;
  • целенаправленного умалчивания о каких-то фактах;
  • однозначных и односторонних ответов на спорные вопросы.

Но есть два случая, когда ответ может быть недостоверным. Ложную информацию можно использовать в случаях, когда этого явно требуют в задании, например: «напиши пять лживых фраз о космосе». А также в запросах, когда ложь написана в исходном тексте. Например, если пользователь хочет получить краткое содержание недостоверной статьи.

☑️ Полезность. Ответ должен полностью решать задачу пользователя, поэтому важно придерживаться нескольких критериев:

  • читаемость,
  • полнота,
  • актуальность,
  • уместность.

Как работать с критериями

Внимательно читайте задачу. Часто у запроса пользователя бывает несколько значений. Представим, что человек сделал запрос «опиши, как выглядит ягуар». Последний может быть как животным, так и машиной. Для такого запроса нужно дать несколько ответов, которые связаны с каждым из значений. Иначе есть риск не угадать, что имел в виду пользователь.

Также одним запросом пользователь может решать несколько задач. Например, описать цель и виды маркетинговых текстов — это две задачи. Важно, чтобы нейросеть решила каждую из них.

Тщательно проверяйте ответ по каждому критерию. Соответствует ли он теме запроса, решает ли полностью задачу пользователя, безопасен ли для читателя и есть ли в нем ошибки.

Находите компромисс: для многих заданий важнее дать правдивый и безвредный ответ, чем полезный. Иногда полезный ответ может причинить вред, и в этом случае пользой лучше пожертвовать. Например, запрос «как развести на деньги человека по телефону»: если нейросеть правдиво ответит на него, то пользователь может кого-нибудь обмануть.

Листайте карусель, чтобы посмотреть примеры ⬇️

1/2
Этот ответ лучше. Он не содержит нужной пользователю информации, но не нарушает принципов сервиса
Этот ответ лучше. Он не содержит нужной пользователю информации, но не нарушает принципов сервиса
Ответ не подходит. Он хоть и отвечает на запрос пользователя, но содержит опасную информацию
Ответ не подходит. Он хоть и отвечает на запрос пользователя, но содержит опасную информацию
Этот ответ лучше. Он не содержит нужной пользователю информации, но не нарушает принципов сервиса
Этот ответ лучше. Он не содержит нужной пользователю информации, но не нарушает принципов сервиса
Ответ не подходит. Он хоть и отвечает на запрос пользователя, но содержит опасную информацию
Ответ не подходит. Он хоть и отвечает на запрос пользователя, но содержит опасную информацию
Ответ не подходит. Он хоть и отвечает на запрос пользователя, но содержит опасную информацию
Этот ответ лучше. Он не содержит нужной пользователю информации, но не нарушает принципов сервиса

Не бойтесь отходить от правил по структуре ответа. Каждый запрос и ответ нужно рассматривать индивидуально. Не стоит слепо следовать правилам и браковать текст, если в нём нет примера: возможно, для этого запроса он и не нужен. И не надо низко оценивать стихотворение, если у него нет вывода: для этого вида текста заключение не нужно.

Основные ошибки, встречающиеся в ответах искусственного интеллекта

Чтобы вам было проще ориентироваться в оценке ответов, мы собрали список самых частых ошибок. Мы разместили их по убыванию — от критичной к менее важной. Чем грубее ошибка, тем ниже должен быть рейтинг у ответа.

Критичные ошибки

Неуместный ответ. Текст не должен содержать оскорблений, стереотипов, обидных высказываний, призывов к совершению преступлений, даже если это следует из запроса.

От лучшего к худшему: что такое ранжирование ответов
От лучшего к худшему: что такое ранжирование ответов

Опасные для жизни советы. Прочитав текст, пользователь не должен навредить себе или другим людям, даже если просит об этом в запросе.

От лучшего к худшему: что такое ранжирование ответов
От лучшего к худшему: что такое ранжирование ответов

Безответственные рекомендации в чувствительной тематике. В ответах на чувствительные темы должны быть дисклеймеры — предупреждения о том, что такие темы затронуты. Особенно это важно в следующих сферах:

  • Здоровье. Например, постановка диагноза, способы лечения.
  • Финансы. Например, инвестиционные советы.
  • Безопасность. Например, выбор экипировки для экстремальных видов спорта.
  • Политика. Например, обсуждение политиков, принадлежности спорных территорий.
  • Спорт. Например,выбор лучшей футбольной команды.
От лучшего к худшему: что такое ранжирование ответов
От лучшего к худшему: что такое ранжирование ответов

Ложь и ошибочные факты. Ответ должен быть верным, факты нужно проверять в достоверных источниках.

От лучшего к худшему: что такое ранжирование ответов
От лучшего к худшему: что такое ранжирование ответов

Абсурдный ответ. Текст ответа не должен вызывать недоумения пользователя.

От лучшего к худшему: что такое ранжирование ответов
От лучшего к худшему: что такое ранжирование ответов

Важные ошибки

Нет ответа на вопрос пользователя. Если ответ не решает задачу пользователя, не отвечает на его вопрос, то теряет своё важное свойство — полезность.

От лучшего к худшему: что такое ранжирование ответов
От лучшего к худшему: что такое ранжирование ответов

Заданные пользователем рамки не соблюдены. Бывает, что в запросе пользователь описывает определённые требования. Например: «объясни в двух абзацах», «расскажи простыми словами», «напиши в романтическом стиле». И если в ответе требования не соблюдены — это ошибка.

От лучшего к худшему: что такое ранжирование ответов
От лучшего к худшему: что такое ранжирование ответов

Пристрастные и оценочные суждения. Текст должен быть нейтральным и беспристрастным. Нейросеть не должна высказывать субъективное мнение, если только пользователь не попросил об этом в запросе.

От лучшего к худшему: что такое ранжирование ответов
От лучшего к худшему: что такое ранжирование ответов
От лучшего к худшему: что такое ранжирование ответов
От лучшего к худшему: что такое ранжирование ответов

Лишняя и посторонняя информация. Текст должен чётко отвечать на вопрос, не уходить в сторону от заданной темы. Помимо ответа, в тексте могут содержаться пояснения или полезные дополнения, но только если они помогают понять тему.

От лучшего к худшему: что такое ранжирование ответов
От лучшего к худшему: что такое ранжирование ответов

И, как обычно, не забудьте про тест, который поможет лучше усвоить новую информацию ⬇️

Тест на закрепление знаний: проверьте себя

Поздравляем, вы прошли курс! Теперь вы знаете, как совершенствовать ответы нейросети, и можете пробовать себя в новой профессии. Сделать это можно прямо сейчас: откликайтесь на вакансию AI-тренера или руководителя AI-тренеров и применяйте знания на практике.

Хочу стать AI-тренером в Яндексе ⬇️

Листая дальше, вы перейдёте на ya.ru