Алгоритмы машинного обучения: что это такое, типы, для чего нужны, обзор основных концепций

Что такое машинное обучение, как работает и где используется

2 893
Оглавление

Результаты машинного обучения внедряются в бизнес на всех уровнях. Чат-боты общаются с клиентами, онлайн-магазины рекомендуют им товары, а роботы не только делают за сотрудников рутинную и опасную работу, но и подсказывают руководителям верные решения.

В статье расскажем, что такое машинное обучение, какие задачи решает и какими способами можно научить компьютер думать на благо компании.

Что такое машинное обучение и как устроено

Машинное обучение — это методы, с помощью которых компьютер учится выполнять действия на основе предыдущего опыта или заданных правил.

Компьютер здесь похож на ребенка, который познает мир. Со временем ребенок понимает, за что его хвалят, и старается вести себя так, чтобы получать похвалу. Так и компьютер запоминает правила, находит взаимосвязи и старается выбирать рациональные и верные пути.

Особенность машинного обучения — это уход от прямого программирования. Прописать код на каждое действие компьютера невозможно — слишком трудозатратно. Поэтому главный принцип машинного обучения в том, чтобы компьютер искал верное решение самостоятельно.

Для обучения компьютера программисты используют разные подходы, которые еще называют типами машинного обучения:

Обучение с учителем. В этом случае компьютеру предлагаются уже размеченные данные: их отсортировали, упорядочили, подсветили признаки, на которые обратить внимание. Машина находит взаимосвязи, запоминает их и применяет в будущем.

Например, компьютеру предлагается база фотографий свежих и испорченных фруктов. Он анализирует изображения, ищет различия, а затем пробует отсортировать новую партию фруктов на складе.

Обучение без учителя. Это обучение происходит в обратном порядке. Машине предлагаются необработанные данные, и она самостоятельно выявляет взаимосвязь между ними. Например, в компьютер хаотично загружаются отчеты о продажах за год. Он анализирует базу и определяет, что в бизнесе есть сезонность: в зимний период возрастают продажи, а летние месяцы — провальные.

Этот тип обучения хорош тем, что помогает увидеть закономерности, которые не заметил бы эксперт. Допустим, маркетолог сегментирует аудиторию только по полу и возрасту и не обращает внимания на то, что самые крупные покупки совершают посетители с детьми. Компьютер выявит и подсветит этот факт.

Обучение с подкреплением. В этом случае компьютер постоянно учитывает предыдущий опыт и учится на ошибках. Ему предлагаются набор базовых правил на входе. Но они учитывают не все возможные исходы. Когда машина сталкивается с неизвестным, она самостоятельно корректирует правила.

Например, обучение с подкреплением используется на фондовых рынках. Обычно цены на акции прогнозируют с помощью математических методов на какой-то период. Но на фондовый рынок влияет слишком много факторов, и котировки акций в любой момент могут отклониться от прогноза. Компьютер учитывает любые отклонения и в моменте меняет прогноз.

Какой тип машинного обучения подойдет, зависит от задачи, которая стоит перед компьютером. А с помощью машинного обучения он уже умеет решать целый ряд задач.

Задачи машинного обучения

Классификация. Компьютер справляется с сортировкой: испорченные фрукты в одну корзину, свежие - в другую; бракованные детали — на контроль, стандартные — в производство. Эта задача решается с помощью обучения с учителем.

Регрессия. Машинное обучение помогает найти закономерности между процессами и сделать прогноз. Например, ставок по кредитам, стоимости квадратного метра жилья и даже погоды. Сервисы погоды делают прогноз на анализе текущей температуры, влажности и облачности.

Кластеризация. Компьютер может не только разделять пул данных на заранее заданные классы, но и определять сами эти классы, на которые разбивается множество. Так, машина обрабатывает данные о продажах и определяет, что последние сильно зависят от времени суток, устанавливает часы тишины и время пиковой загрузки. Эти данные можно использовать для перераспределения трафика. Здесь применяются методы обучения без учителя — компьютер сам анализирует данные и обнаруживает нужные временные промежутки.

Обработка текста и речи. Еще одна задача машинного обучения — анализ текста и поиск в нем информации. Например, поискового запроса среди тысяч похожих сайтов. Современные компьютеры даже научились определять тональность текста: написан ли он с позитивными или негативными эмоциями. Это помогает, например, распознать жалобы среди всех обращений в компанию и быстрее на нее отреагировать.

Голосовые помощники умеют распознавать и речь. Они могут самостоятельно ответить на вопросы или переадресовать звонок.

У MANGO OFFICE есть сервис «Голосовой робот» — это универсальный виртуальный помощник для бизнеса любого размера и отрасли. Он предназначен для автоматизации простых диалогов, алгоритм которых можно уложить в скрипт. С его помощью вы сможете повысить продажи и увеличить производительность колл центра.

Это далеко не все возможности машинного обучения. А как они реализуются, зависит от алгоритма, который в нем заложен.

Обзор алгоритмов машинного обучения

Алгоритмы машинного обучения дают понять, как именно учится компьютер или что он будет делать с загруженными в него данными. Таких алгоритмов используется много. Рассмотрим некоторые из них.

Линейная и логистическая регрессия

Простой алгоритм машинного обучения, который применяется давно. В основе алгоритма лежит регрессия — метод математической статистики, который выявляет закономерность между несколькими показателями. Если знать эту закономерность, можно спрогнозировать значение одного показателя в зависимости от значения другого.

Так, в маркетинге предсказываются доходы компании по расходам на рекламу. Или в сельском хозяйстве делается прогноз урожайности в зависимости от количества удобрений. Точным этот метод будет в том случае, если между параметрами действует линейная зависимость. Графически такая связь выглядит как прямая.

А вот если предсказываемый параметр принимает только два альтернативных значения (да или нет), то прямая плохо описывает модель. Нужен более резкий переход между вариантами, который дает логистическая функция.

Компьютер действует по алгоритму следующим образом:

  1. Анализирует данные и выявляет взаимосвязь;
  2. Строит линию, которая будет отражать найденную зависимость (красный пунктир);
  3. Определяет значение искомого параметра Y в зависимости от заданного (X). В случае логистической регрессии параметр Y примет значение либо 1 (да), либо 0 (нет).

Методы регрессионного анализа не подойдут, если событие зависит не от одного или двух, а от ряда параметров. В этом случае компьютер будет выдавать результаты с большой погрешностью. Тогда лучше использовать другие алгоритмы машинного обучения, например, дерево решений.

Дерево решений и случайный лес

По этому алгоритму компьютер последовательно отвечает на вопросы и принимает решения. Список вопросов или цикл загружается заранее. И каждое новое событие компьютер прогоняет по этому циклу. А в конце выдает ответ: как поступить, к какому классу отнести объект или какова вероятность того или иного события.

Этот алгоритм учитывает большое количество факторов. Если их не получается совместить в одном дереве, строится несколько таких циклов — случайный лес. А на выходе определяется самый мощный критерий.

Дерево решений часто используют в скриптах для общения голосового помощника с клиентами. Помощник поочередно задает вопросы и предлагает клиенту варианты решения в зависимости от ответов.

К-ближайших и К-средних

Такие алгоритмы помогают решать задачи классификации или группировки по заранее заданным категориям. И кластеризации — самостоятельного разделения данных на кластеры.

Метод К-ближайших работает с данными, которые уже разделены на группы. Машина определяет, к какой из групп отнести новое значение. Для этого вокруг значения очерчивается периметр, в который попадает несколько ближайших точек (К). Значение относится к той группе, точек которой в периметре оказалось больше.

А метод К-средних работает с несортированными данными. Задается количество групп (К), на которые компьютер будет делить эти данные. Машина анализирует схожие признаки у каждой единицы и сортирует их по группам.

Алгоритм К-ближайших применяют, например, в медицине, когда по симптомам диагностируют болезнь, и пациент относится к той или иной группе. А классический пример алгоритма К-средних — это сегментация клиентов. Маркетолог задает количество сегментов, которые хочет получить. А компьютер выделяет признаки, по которым лучше разделить клиентов.

Нейронные сети

Новый алгоритм обучения, который активно развивается. Нейронная сеть — это программа, которая обрабатывает данные по принципу человеческого мозга. Нейросеть устроена сложно. Модель состоит из нескольких слоев нейронов, которые соединяются друг с другом синапсами (связями). Информация, которая попадает в нейросеть, проходит через все слои и связи иногда по несколько раз. Она классифицируется, сортируется и преобразуется так, что на выходе получается готовое решение.

По мере получения опыта нейронная сеть, как и мозг, сама формирует новые связи (запоминает информацию). Задача программиста, который занимается обучением нейросети — отслеживать, правильные ли связи она создала или нет.

Нейронные сети только набирают популярность, но уже используются для распознавания лиц, имитации голосов, создания изображений.

Примеры использования машинного обучения

Машинное обучение используется везде. Даже далекие от мира технологий люди больше не удивляются контекстной рекламе и персональным подборкам в приложении музыки. Еще несколько интересных направлений, в которых внедряются основные алгоритмы машинного обучения:

Здравоохранение. Компьютер диагностирует болезни, например, выявляет онкологию на ранних стадиях. Он сопоставляет внешний вид, размеры, контуры опухоли с данными загруженной в него статистики. По результатам анализа выдает ответ, злокачественное ли это образование или нет. По точности результатов эта технология уже превосходит человека.

Обученные роботы помогают и хирургам: сопровождают операции, сообщают врачу важные детали, помогают принимать решения. О полной замене человека говорить пока рано, но роботов уже тренируют накладывать швы на муляжах.

Транспорт. Системы автопилота уже научились автономно управлять любым транспортом, будь то автомобиль, аэромобиль или дрон. Но даже простой круиз-контроль, который есть в каждом современном автомобиле, — это результат машинного обучения.

Искусство. Появились первые разработки машинного обучения, которые создают музыкальные композиции, самостоятельно обрабатывают фотографии и имитируют стили художников или направления живописи. Такая программа может из обычной фотографии сделать картину Ван Гога.

Подробнее о том, как используется искусственный интеллект в бизнесе.

Главное

  • Машинное обучение — это способ обучения компьютера без активного программирования на основе заданных правил или полученного опыта.
  • С помощью машинного обучения компьютер решает пул задач: сортирует данные самостоятельно или по заранее заданным группам, ищет закономерности, обрабатывает речь и текст и не только.
  • В основе обучения компьютеров лежат разные алгоритмы: от линейной регрессии до сложных нейронных сетей. Алгоритмы машинного обучения уже применяют в каждой сфере жизни общества.