Ученые-программисты хотят, чтобы роботы забыли свои плохие данные

$config[ads_kvadrat] not found

Настя и сборник весёлых историй

Настя и сборник весёлых историй
Anonim

Когда «плохие» данные засасываются в систему машинного обучения - так выразился Алан Гринспен при обсуждении компьютерных моделей, которые не смогли предсказать рецессию 2008 года, - эту информацию трудно обнаружить. Но новая концепция, предложенная учеными-компьютерщиками Цзюньфэном Янгом и Иньчжи Цао из Колумбийского университета и Университета Лихай, соответственно, привносит идею обучения компьютерам. Как Цао и Ян пишут в аннотации, опубликованной для конференции IEEE Xplore 2015 года, вам не нужно возвращаться к исходной точке, чтобы забыть:

Чтобы забыть выборку обучающих данных, наш подход просто обновляет небольшое количество сумм - асимптотически быстрее, чем переподготовка с нуля. Наш подход является общим, потому что форма суммирования основана на статистическом изучении запросов, в котором могут быть реализованы многие алгоритмы машинного обучения. Наш подход также применим ко всем этапам машинного обучения, включая выбор характеристик и моделирование. Наша оценка четырех различных систем обучения и реальных рабочих нагрузок показывает, что наш подход является общим, эффективным, быстрым и простым в использовании.

Концепция машинного обучения опирается на фундамент, построенный из кучи информации. Это может быть полезно, чтобы научить роботов или искусственный интеллект устанавливать определенные связи - например, если человек в тяжелой куртке владеет топором, он или она может быть пожарным. Но в этих учебных сессиях могут возникать ошибочные соединения, основанные на наборе данных. Ваш робот может подумать, что у всех пожарных есть бороды. Это, очевидно, то, что вы хотели бы, чтобы компьютер unthink.

Цао и Ян основывают эту идею роботизированной информационной развязки на концепции происхождения данных - эти данные не полностью сформированы в мире, но имеют прослеживаемую историю при обработке необработанных данных, отмечает Курцвейл А.И., Использование этой линии позволяет машинам отучиться от выбранных частей данных, не стирая полностью их образование.

$config[ads_kvadrat] not found