Walton Electronics Co., Ltd.
Свяжитесь мы

Контактное лицо : Walton-cara

Номер телефона : 15986872308

Free call

Машинное обучение требует множественных шагов

July 18, 2022

Введение

Раскрывая машинное обучение (ML) процесс мульти-шага. Оно включает выбрать модель, натренировать его для специфической задачи, утвердить его с проверками данных, и после этого раскрыть и проконтролировать модель в продукцию. Здесь, мы обсудим эти шаги и сломаем их вниз для того чтобы ввести вас к ML. ML ссылается на системы которые, без точной инструкции, способны на учить и улучшать. Эти системы учат от данных выполнить определенные задачу или функцию. В некоторых случаях, учащ. или более специфическая тренировка, происходит в, который наблюдали образе где неправильные выходы приводят в регулировать модель для того чтобы подталкивать ее к правильному выходу. В других случаях, бесконтрольный учить происходит где система организует данные для того чтобы показать ранее неизвестные картины. Большинств модели ML следовать этими 2 парадигмами (, который наблюдали против бесконтрольный учить). Позвольте нам теперь выкопать во что значено моделью и после этого исследуйте как данные будут топливом для машины leamning. Модель модели a машинного обучения абстракция решения для машинного обучения. Модель определяет。 архитектуры что, как только натренированный, будет вставкой. Поэтому, мы не раскрываем модели. Мы раскрываем вставки моделей натренированных от данных (больше на этом в следующем разделе). Так модели плюс данные плюс тренировка равных примеров решений ML (Figure1). перевод необходим. Например, питаясь данные по текста в глубокую уча сеть требуют шифруя слов в численную форму которая обыкновенно высоко-габаритный вектор, который дали различные слова которые смогли быть использованы. Подобно, выходы могли требовать перевода от численной формы назад в текстуальную форму. Модели ML приходят в много типов, включая модели нервной системы, Bayesian модели, регрессионные модели, связывая модели, и больше. Модель что вы выбираете основана на проблеме под рукой. В контексте нервных систем, ряд моделей от мелких мульти- сетей слоя к глубоким нервным системам которые включают много слоев

специализированных нейронов (устройств обработки данных). Глубокие нервные системы также имеют ряд доступного моделей основанного на вашем применении цели.

Например:

●Если ваше применение сфокусировано на определять объекты в пределах изображений, то Convolutional нервная система (CNN) идеальная модель. CNNs было приложено к обнаружению кож-рака и делает средний дерматолога лучше.

●Если ваше применение включает предсказать или произвести сложные последовательности (как человеческие предложения языка), то возвратные нервные системы (RNN) или Длинн-короткие сети Услови-памяти (LSTM) идеальные модели. LSTMs также было приложено к машинному переводу человеческих языков.

●Если ваше применение включает descrbing содержание изображения в человеческий язык, то сочетание из CNN и LSTM можно использовать (где изображение кормится в CNN и выход CNN представляет входной сигнал к LSTM, которое испускает последовательности слова).

●Если ваше применение включает произвести реалистические изображения (как ландшафты или стороны), то генеративная враждебная сеть (GAN) представляет настоящую модель stat---искусства. Эти модели представляют некоторые из более популярных глубоких нервных архитектур сети в пользе сегодня. Глубокие нервные системы популярны потому что они могут признавать неструктурированные данные как изображения, видео, или аудио информация. Слои внутри стройка сети иерархия особенностей которые позволяют им clasify очень сложная информация. Глубокие нервные системы демонстрировали современное представление над широким количеством доменов проблемы. Но как другие модели ML, их точность зависит на данных. Позвольте нам исследовать этот аспект затем.

Данные и тренировка

Данные топливо которое управляет машинным обучением, не как раз в деятельности но также строить решение ML через модельную тренировку. В контексте тренируя данных для глубоких нервных систем, важно исследовать необходимые данные в контексте количества и качества. Глубокие нервные системы требуют большое количество данных для тренировки. Один эмпирический способ для основанной на анализе изображений классификации 1 000 изображений

в класс. Но ответ зависит на сложности модели и допуска для ошибки. Некоторые примеры от решений ML продукции производят спектр размеров набора данных. Лицевое detecti дальше и система распознавания требовали 450 000 изображений, и средство болтовни и-ответа вопроса было натренировано с 200 000 вопросами спаренными с 2 миллиона ответами. Более небольшие наборы данных могут также быть достаточным основанный на будучи разрешанными проблеме. Решение анализа чувства которое detrmines полярность мнения от десяток требуемых письменным текстом только тысяч образцов. Качество данных как раз как важно как количество. Данный большие наборы данных необходимы для тренировки, даже небольшие количества ошибочных тренируя данных могут привести к плохому решению. В зависимости от типа данных необходимых, ваши данные могли пойти через очищая процесс. Это обеспечивает что набор данных последователен, нуждается двойных данных, точно, и закончено (нуждает инвалидном или неполных данных). Инструменты существуют для того чтобы поддержать этот процесс. Утверждать данные для смещения также важен для обеспечения что данные не водят к пристрастному решению ML. ML тренировки приводится в действие дальше цифровые данные, так предварительно обрабатывая шаг можно необходим в зависимости от вашего решения. Например, если ваши данные человеческий язык, то их необходимо сперва перевести в численную форму для обработки. Изображения можно предварительно обрабатывать для последовательности. Например, изображения питались в глубокую нервную систему были бы изменять размеры и были бы приглажены для того чтобы извлечь шум (среди другой деятельности). Одна из самых больших проблем в ML приобретает набор данных для тренировки вашего решения ML. Это смогло быть самой большой работой в зависимости от вашей проблемы потому что оно не могло существовать и требовать отдельное усилие

захватить. В конце концов, набор данных должен быть поделен на сегменты между тренируя данными и проверками данных. Тренируя часть использована для тренировки модели, и раз натренированный, проверка данных использована для того чтобы утвердить точность решения

 

Свяжись с нами

Впишите ваше сообщение