Задача создания, обучения и развития ИИ - очень трудоемкая задача для многих десятков тысяч людей.
Намита Прадхан сидит за столом в офисе, расположенном в центре индийского города Бхубанешвар, изучая видео, снятое в больнице на другой стороне мира. Г-жа Прадхан ищет полипы, небольшие наросты в толстой кишке, которые способны привести к раку. Находя нечто похожее, помечает, рисуя мышкой кружок вокруг крошечной выпуклости. У нее нет медицинского образования, но она занята обучением искусственного интеллекта, который, в дальнейшем возьмет на себя работу врача.
Г-жа Прадхан — одна из сотен молодых индийских женщин и мужчин, работающих в этом офисе. Все они были обучены комментированию разнообразных цифровых изображений и точному обозначению объектов на них, от дорожных знаков до заводов и нефтяных танкеров со спутниковых фотографий.
Искусственный интеллект, как подтвердит вам большинство людей из мира технологий, — это будущее отрасли, и он быстро улучшается благодаря тому, что называется машинным обучением. Однако технические руководители редко обсуждают этот трудоемкий процесс. ИИ учат люди. Много-много людей. Они называют себя «турками».
Прежде чем ИИ сможет чему-то научиться, кто-то должен разметить поставляемые ему данные. Например, люди должны точно определить где и как выглядят полипы в кишечнике на видео. Подобные задачи имеют жизненно важное значение для применения искусственного интеллекта в таких приложениях, как самоуправляемые автомобили, системы наблюдения и автоматизированное здравоохранение.
Технологические компании предпочитают не распространяться об этой работе, но мне удалось получить разрешение, редко кому предоставляемое волшебниками Силиконовой долины и заглянуть за занавес. Я совершил извилистую поездку по Индии и завершил свое путешествие в Нового Орлеана. В общей сложности я посетил пять офисов специализированной компании iMerit», сотрудники которой заняты выполнением непередаваемо однообразной работой, необходимой для обучения ИИ. Там есть, например, специалисты по обследованию внутренностей, как г-жа Прадхан, и специалисты по отличию обычного кашля от опасного. Там есть лингвисты и уличные сценографы. Что такое дорожная разметка? Двойная желтая линия или пунктирная белая? Роботизированный автомобиль должен понимать это точно.
То, что я увидел, совсем не походило на офис будущего — или, по крайней мере, каким вы можете его себе представить. Гораздо больше похоже на колл-центры или центры обработки платежей. Тот, который посетил я был просто старым бывшим многоквартирным домом в центре бедного района Западной Калькутты, изобиловавшим пешеходами, авторикшами и уличными торговцами. В таких учреждениях, как и в других городах Индии, Китая, Непала, Филиппин, Восточной Африки и Соединенных Штатов, десятки тысяч рабочих днями напролет учат машины.
Другие десятки тысяч работников или независимых подрядчиков, предпочитающих надомную работу, также принимают участие в обучении, нанимаясь с помощью краудсорсинговых интернет-компаний, распределяющих цифровые задачи независимым исполнителям.
Основанная в Индии, компания iMerit занимается маркировкой данных для многих технологических и автомобильных гигантов. Среди их постоянных клиентов Amazon и Microsoft. Компания понимает, что однажды искусственный интеллект может разрушить рынок труда. Но пока здесь создаются рабочие места. Рынок определения данных по мнению экспертов составлял 500 млн долларов в 2018 году и достигнет 1,2 млрд к 2023 году. Эта нудная, однообразная работа, как показывают исследования, составляет до 80 процентов всего времени, затраченного на создание технологии ИИ.
Является ли такая работа эксплуататорской? Это зависит от того, где вы живете и над чем работаете. В Индии, это билет в средний класс. И даже в Новом Орлеане это может быть достаточно приличной работой. А вот для частного надомника это путь в тупик.
Есть навыки, которые следует изучить загодя — например, обнаружение признаков болезни в видео или медицинском скане или навык уверенной обрисовки цифровым «лассо» изображения автомобиля или дерева. В особых случаях, когда задача включает изучение медицинского видео, просмотра порнографии или иллюстраций жестокости, работа становится кошмарной. «Когда вы впервые видите такие вещи, это шокирует. Нет никакого желания возвращаться к такой работе. Но для тех, кто не может позволить себе ее бросить, приходится возвращаться и делать это», — говорит Кристи Милланд, проведшая годы работы на маркировке данных.
Перед поездкой в Индию я сам попробовал маркировать изображения, обрисовывая прямоугольниками логотипы одной спортивной фирмы на фотографиях. Тоска смертная. И даже тест, который я должен был пройти перед началом этой работы, приводил в уныние. Маркировка изображений для розничных товаров совсем не вдохновляет.
Исследователи ИИ надеются, что в дальнейшем им удастся построить системы, которые смогут учиться на меньших объемах данных. Но в обозримом будущем от гигачасов человеческого труда никуда не деться.
Бхубанешвар называют городом храмов. Древние индуистские святыни возвышаются над придорожными рынками — гигантские каменные башни, датируемые первым тысячелетием до нашей эры. Даже в центре города многие улицы немощеные. Коровы и бездомные собаки бродят среди мопедов, легковых и грузовых автомобилей. Город с населением 830 000 человек является быстро растущим центром дешевого онлайн-труда.
Примерно в 15 минутах езды от храмов, недалеко от центра города, стоит белое четырехэтажное здание. Внутри располагаются три зала, заполненные длинными рядами столов, на каждом из которых стоит компьютерный монитор. За одним из них и работает Намита Прадхан, маркируя чьи-то полипы.
Г-жа Прадхан выросла недалеко от города и получила образование в местном колледже, где изучала биологию, прежде чем поступить на работу в компанию. Она живет в общежитии рядом с офисом и лишь на выходные уезжает к семье.
Я посетил офис в обычный январский день. Некоторые женщины, сидевшие за столами, были одеты традиционно — ярко-красные сари, длинные золотые серьги.
В течение восьмичасового рабочего дня, застенчивая 24-летняя девушка просмотрела около десятка видеозаписей колоноскопии, постоянно меняя масштаб картинки для более тщательного обзора отдельных кадров.
Время от времени она находит то, что ищет. Тогда она отмечает их на экране, оставляя множество пометок, где указываются полипы и другие признаки болезней, как сгустки крови и воспаления. Ее клиент, медицинская компания из США, в конечном итоге скормит ее работу искусственному интеллекту, чтобы тот мог самостоятельно диагностировать проблемы пациентов.
Г-жа Прадхан занималась этой задачей в течение семи дней, периодически консультируясь по видеосвязи с врачом из Калифорнии, помогающим обучать работников во многих офисах компании. Когда мы обсуждали ее работу, мисс Прадхан назвала ее довольно интересной, но утомительной. А что касается видео? — Сначала это кажется отвратительным, но потом привыкаешь. Изображения, которые она маркировала, были неприятными, но не настолько, как те, с которыми ей приходилось сталкиваться раньше, когда клиентам требовалось обучать искусственный интеллект, способный находить, идентифицировать и удалять шокирующие изображения в социальных сетях и других онлайн-сервисах.
Подобная работа может настолько психологически травмировать работников, что компания даже пыталась ограничить то, что они видят. Порнография и насилие разбавлялись более безобидными изображениями, а те, кто сталкивался с выполнением таких задач, работали в отдельных помещениях. «Не удивлюсь, если это вызывает посттравматическое стрессовое расстройство или еще хуже. Нелегко найти людей, способных к такой долговременной работе. Нужно обязательно смешивать работу с маркировкой отвратительных изображений другой работой, рабочим нельзя постоянно смотреть на порно и рубку голов.»
По словам одного из руководителей компании, г-жа Прадхан и ее коллеги зарабатывают от 150 до 200 долларов в месяц, принося при этом по 1000 долларов дохода для iMerit. По американским стандартам, зарплата г-жи Прадхан неприлично низкая. Но для нее и многих других девушек речь идет о вполне средней зарплате в индийских стандартах. В iMerit в настоящее время работает около 2500 человек. Более 80% из семей с доходом ниже 150 долларов в месяц. Средний возраст сотрудников составляет 24 года, большинство из них родом из деревень. «Мы хотим привлечь людей из малоимущих слоев населения на технологические рабочие места»,- говорит г-жа Радха Басу, основавшая iMerit после долгой карьеры в Силиконовой долине в технологических гигантах Cisco Systems и HP.
Изначально ее компания выполняла простейшие задачи, такие как сортировка товарных списков для интернет-магазинов или контроль за сообщениями в социальных сетях, но со временем смогла переквалифицироваться на работу с данными, питающими искусственный интеллект.
Существенное отличие компании от множества краудсорсинговых фирм, механически раздающих заказы через интернет, заключается в том, что ее сотрудники обучаются в процессе работы, повышая свой уровень, благодаря чему развивается и сама компания, получая более интересные и выгодные контракты. Так, iMerit занимается маркировкой улиц, используемых в обучении беспилотных автомобилей для крупной компании в США. Специальный отдел анализирует и размечает фотографии, а также трехмерные изображения, снятые лазерным локатором, измеряющим расстояния с помощью световых импульсов.
Мастера кашля
Через несколько недель по возвращению из Индии я отправился в центр Нового Орлеана. Здесь, полтора года назад iMerit открыла свое представительство.
Тогда крупная американская технологическая компания нуждалась в маркировке данных для испаноязычной версии своего голосового ассистента. Они обратились в новый новоорлеанский офис iMerit. Сотни строителей с семьями приехали в Новый Орлеан после урагана Катрина в 2005 году для восстановления полуразрушенного города. Многие их них остались в нем жить. Среди них было полно испаноязычных, которых компания привлекла их к работе над ассистентом.
Оскар Кабесас переехал с матерью в Новый Орлеан из Колумбии и после окончания колледжа поступил на работу в iMerit, где начал работать над испаноязычной версией ассистента, определяя для искусственного интеллекта все, от твитов до обзоров ресторанов, идентифицируя людей и места, расшифровывая двусмысленности. В Гватемале, например, испанское слово «Pisto» (поршень) означает деньги, а в Мексике — пиво.
Кроме того, благодаря офису в США компания смогла получать заказы, обслуживая предприятия, желающие сохранить свои секреты в пределах Соединенных Штатов.
42-летняя Гленда Эрнандес из Гватемалы, работает на проектах, включающих аннотации аудиозаписей кашляющих людей. Так обучался искусственный интеллект, идентифицирующий симптомы болезни по телефону.
- Слушать кашель весь день довольно противно, — сказала она. Тем не менее, труд г-жи Эрнандес призван помочь врачам выполнять свою работу. Через несколько минут после жалоб на проект, она указала на своих коллег в другом конце офиса и сказала с гордостью: — Мы были мастерами распознавания кашля.
В 2005 году Кристи Милланд получила свой первый заказ через интернет на краудсорсинге. Ей было 26 лет, и она жила в Канаде с мужем, управляющем местного склада. Ее подработка могла принести семье дополнительный доход. Первый ее проект предназначался для Amazon. На экране ноутбука открывались фотографии витрин магазинов, и она отмечала те из них, на которых была изображена входная дверь.
Amazon создавала онлайн-сервис, сходный с Google Street View и компании нужна была помощь в отборе лучших фотографий. Таким образом, Кристи зарабатывала по три цента за каждый клик, или около 18 центов в минуту. В 2010 году ее муж потерял работу, и распознавание образов стало основным семейным заработком. В течение двух лет она работала семь дней в неделю, иногда по 17 часов в день. Заработок составлял около 50,000 долларов в год. «Тогда этого было достаточно, чтобы жить. Но не теперь», — сказала Милланд.
Для других проектов она вводила информацию из ипотечных документов или перепечатывала имена и адреса с фотографий визитных карточек, порой всего за доллар в час.
Начиная с 2010-го года ей пришлось столкнуться с маркировкой других данных, от изображений кровавого насилия до аэрофотоснимков, вероятно, сделанных где-то на Ближнем Востоке (предположительно для ИИ, нужного военным для идентификации целей беспилотников). Заказы американских технологических гигантов, по словам госпожи Милланд, обычно оплачиваются дороже, чем обычные заказы — около $15 в час. Но такая работа не сопровождается соцпакетом или оплачиваемым отпуском, и при этом могла быть крайне мерзкой. Она назвала такое сотрудничество «ужасающей эксплуатацией».
С 2012 года г-жа Милланд вступила в организацию «Turker Nation», стремящуюся улучшить условия для тысяч людей, занятых рутинной работой по маркировке данных. В этом году она прекратила всякую деятельность, связанную с обработкой данных. И несмотря на то, что семья испытывает определенные финансовые трудности, возвращаться к прошлой работе она категорически не хочет. «С меня хватит» — сказала она.