Какие преимущества дают нейросети и где они уступают способностям человека? Почему нейросети изменят нашу жизнь, как проектируют «нейронки», где можно применять технологию не ради хайпа, а для пользы бизнеса (пример — оцифровка данных и работа с ними), какие нейросети наиболее знамениты сегодня и в чем их ограничения.
Нейронные сети и другие методы машинного обучения уже сейчас значительно влияют на то, как мы живём, развлекаемся и работаем.
Персонализированные рекомендации музыки, подборка фильмов на основе предыдущих интересов, персонализированные новости (Flipboard и Google News) и реклама, чат-боты и голосовые помощники/ассистенты (робот Макс на Госуслугах), генерация контента (GPT-3) – это всё примеры работы нейросетей, которыми мы уже пользуемся в обычной жизни.
Нейросети можно использовать для оптимизации различных экономических процессов и операций, получая при этом выгоду в виде удешевления и ускорения за счет автоматизации. С их помощью можно автоматизировать производственные процессы, повысить эффективность труда, оптимизировать логистические цепочки, автоматизировать складскую работу, контролировать безопасность. На «нейронках» разрабатывают беспилотный транспорт, оптимизируют транспортные потоки. Технологию используют в сервисных целях – для рутинной работы вроде переноса данных из документов в инфосистемы, для разработки экспертных систем поддержки принятия решений, госуправления развитием на основе данных.
Для коммерческих технологических продуктов нейронные сети часто используются в сочетании с другими алгоритмами и технологиями ИИ. Вместе с компьютерным зрением их используют в беспилотном транспорте, в безопасности и т.д. Нейросеть + технологии компьютерного зрения и машинного обучения может быть удачным решением для оцифровки документов – перевода аналоговых данных в электронный вид; для анализа смыслов в оцифрованных документах и автоматизации юридических проверок также используют технологии обработки естественного языка (NLP) – здесь открывается путь к разработке «цифровых помощников», которые большую часть рутинных действий выполняют за человека. Например, такой помощник может взять на себя до 90% рутинных проверок комплектов документов, оставляя за человеком финальное решение по тому или иному вопросу. Машинное обучение в медицине помогает проводить анализ изображений на основе предобученных на больших кластерах данных нейросетей, что помогает находить отклонения, которые не заметит даже опытный диагност.
Существует множество типов нейронных сетей, каждый из которых предназначен для определенного типа задач. Например, сверточные нейронные сети (CNN) обычно используют для распознавания изображений, видео, а рекуррентные (RNN) — для обработки последовательных данных, таких как текст. Генеративно-состязательные сети (GAN) – для получения фотореалистичных изображений, например для элементов промышленного дизайна, дизайна интерьера, раздичных предметов гардероба и аксессуаров.
Нейросеть – это математическая модель, обучаемая вычислительная структура, которая представляет собой систему взаимосвязанных алгоритмов. Её используют для предсказания, классификации или генерации данных с помощью специально подобранных функций. Нейросети как метод машинного обучения — это способ заставить машины думать, подражая человеческому мышлению, биологическим нейронным сетям. Важно: ИИ имитирует человеческое мышление. В обозримой перспективе научить «нейронку» думать как человек не получится , потому что ещё никто не понял, как на самом деле функционирует человеческий мозг.
Некоторую универсальность технологии нейросетей — хотя она не универсальна — объясняют следующим фактами:
В целом, нейронные сети хорошо подходят для задач, связанных с распознаванием образов, классификацией и прогнозированием, задач обработки большого количества данных. Инструменты исследования на базе ИИ могут помочь сузить большие объемы информации, чтобы найти наиболее актуальные и полезные фрагменты данных.
Проектирование нейронной сети — непростой процесс. Однако благодаря таким инструментам разработки, как Keras и TensorFlow, он становится все более доступным для исследователей и практиков в самых разных областях.
Первое, что нужно сделать, разрабатывая нейросеть — определить проблему, которую она будет решать, и собрать данные, на которых её придется обучать. На этом этапе часто всё может закончиться, поскольку самая распространенная проблема в обучении нейросетей под реальные бизнес-задачи – отсутствие нужного объёма или качества данных.
Далее следует выбрать сетевую архитектуру под решаемую задачу, количество и тип слоев в сети, количество узлов в каждом слое. Существует множество различных сетевых архитектур, таких как сети с прямой связью, сверточные сети и рекуррентные сети.
Чтобы измерить, насколько хорошо сеть работает с данными, нужно определить функцию потерь. Цель в том, чтобы минимизировать функцию потерь, регулируя «веса» сети во время обучения. Например, функция потерь под названием среднеквадратичная ошибка (MSE) — обозначает среднее значение ошибок между прогнозными значениями и реальными значениями — позволяет гарантировать, что обученная модель не будет очень сильно ошибаться. Выбор функции потерь зависит от решаемой задачи. Общего правила выбора не существует.
Обучение сети. Во время обучения на данных включает в себя настройку весов сети с использованием алгоритма оптимизации. Цикл обучения повторяется до тех пор, пока сеть не достигнет нужного или приемлемого уровня производительности.
Оценка обученной сети: нужно убедиться, что сеть не просто запоминает обучающие данные, но вместо этого учится обобщать новые данные.
Уточнение. На основе результатов оценки сеть можно уточнить, изменив ее архитектуру, изменив функцию потерь или изменив процесс обучения. Процесс продолжается до тех пор, пока сеть не достигнет нужного уровня производительности.
Обучение с учителем. Данные на входе представляют собой пары: объект и его характеристику. Подход применяется, например, в распознавании изображений. Нейросеть обучают на базе картинок, размеченной вручную, с пометками, что именно представлено на каждой картинке. Ориентируясь на эти примеры, нейросеть начинает отличать изображения, например, кошек и собак. Разработчики вручную присваивают степень уверенности (веса) по отношению к распознанным изображениям. Процесс повторяется до тех пор, пока точность распознавания не повышается до искомой.
Обучение без учителя. Часто применяют как этап предобучения для дальнейшего обучения с учителем. Сеть учится искать закономерности в представленных данных. Не подходит, если надо получить на выходе решение с высокой степенью уверенности.
Обучение с подкреплением. Машина пытается решить задачу разными способами, ошибается и учится на своих ошибках, улучшает свои показатели. Этот метод используют в первую очередь там, где шине нужно выживать в реальной среде, выбрать лучший вариант среди многих или достичь сложной цели за множество ходов. Например, его активно применяют в робототехнике.
Основная проблема в обучении нейросетей – наличие большого количества правильно размеченных данных.
GPT-3 (Generative Pre-trained Transformer 3) — языковая модель глубокого обучения, разработанная OpenAI. Способна генерировать текст, подражая человеку, переводить, делать обобщения и развернуто отвечать на вопросы.
DALL·E 2 – разновидность GPT-3, созданная OpenAI, которая создает изображения из текстовых описаний.
Midjourney одноименного разработчика — создает картинки по запросам, особенно хорошо подражая разным художественным стилям
ResNet (Residual Network) — глубокая сверточная нейронная сеть, разработанная Microsoft, которая используется для классификации изображений и распознавания объектов. Выиграла несколько конкурсов по распознаванию изображений и широко используется в исследованиях компьютерного зрения.
BERT (двунаправленные представления кодировщика от трансформеров) — языковая модель глубокого обучения, разработанная Google, которая используется для задач обработки естественного языка, таких как ответы на вопросы, анализ настроений и классификация текста.
AlphaGo — алгоритм глубокого обучения с подкреплением, разработанный Google DeepMind, который смог победить чемпиона мира в сложной настольной игре Го. Это был один из первых примеров алгоритма машинного обучения, способного изучать сложные стратегии и принимать решения автономно.
VGG (Visual Geometry Group) — глубокая сверточная нейронная сеть, разработанная исследователями Оксфордского университета, которая используется для распознавания изображений и обнаружения объектов. Добилась самых высоких результатов в нескольких эталонных задачах распознавания изображений. Уже не самая новая архитектура с избыточным количеством параметров.
По мере того, как нейронные сети становятся все более сложными и способными, растет интерес к этическим и социальным последствиям внеднерия нейросетей во все сферы жизни. Например, есть опасения по поводу возможной предвзятости алгоритмов машинного обучения и влияния ИИ на занятость и экономическое неравенство. Но все опасения упираются в тот момент, сколько полномочий будет выделено ИИ. Пока что критические задачи ему доверять не спешат, что отмечает большое количество иссдеователй.
Сложность работы с нейронными сетями в том, что фактически они представляют собой черный ящик. Кроме результата, из нейросети редко можно вытащить что-то ещё, даже статистические данные. Отсюда возникает вопрос доверия к решениям, которые принимают нейросетевые алгоритмы.
Эта особенность делает проблематичным применение нейронных сетей там, где ошибки критичны. Например, в финансовой сфере, медицине, в государственном управлении и т.д. Именно по этой причине сейчас всё больше утверждается концепция искусственного интеллекта, как цифрового помощника человека, но не самостоятельной системы, которая может принимать автономные решения. Появление сильного ИИ — как Скайнет в терминаторе – маловероятно.
Хотите убедиться, что самые продвинутые нейросети могут плохо справляться с задачами? Попросите DALLE нарисовать человеческие руки.
«Нейронки» можно ограниченно применять в задачах, где есть неопределенность, а также задачах, требующих интерпретации и анализа сложных понятий: сети плохо воспринимают сложные запросы и связанные с ними интуитивные понятия. Повышать уверенность нейросети в распознавании новых закономерностей, с которыми она не сталкивалась в процессе обучения, можно постепенно. Нейросеть не справится с нестандартной ситуацией без подсказки со стороны супервайзера-человека.
Одна нейронная сеть, как правило, может хорошо решать только одну задачу. При переобучении есть так называемая «проблема катастрофической забывчивости».
Нейронные сети также могут отъедать слишком много ресурсов на обучение, поскольку требуют большого количества данных, а значит и высокой аппаратной производительности. Бесконечно увеличивать мощности вычислительных центров не получится – это слишком дорого и вредно для экологии, не вписывается в «зеленую» повестку многих стран.
Под вопросом и эффективность коммерческих внедрений отдельных решений на базе нейросетей. Технология экономически целесообразны для обработки больших потоков данных и всё ещё бывает слишком дорога для малого и среднего бизнеса.
Работаем только с юридическими лицами
Работаем только с юридическими лицами.
Работаем только с юридическими лицами.