機器學習是AI的一個子集,通常分為兩大類:有監(jiān)督學習和無監(jiān)督學習。
監(jiān)督學習
教學AI系統(tǒng)的常用技術(shù)是通過使用大量帶標簽的示例來訓練它們。這些機器學習系統(tǒng)被饋入大量數(shù)據(jù),這些數(shù)據(jù)已被注釋以突出顯示感興趣的功能。這些照片可能被標記為照片以表明它們是否包含狗或帶有腳注的書面句子,以表明“低音”一詞與音樂還是魚類有關。經(jīng)過培訓后,系統(tǒng)便可以將這些標簽罐應用于新數(shù)據(jù),例如應用于剛剛上傳的照片中的狗。
通過示例教學機器的過程稱為監(jiān)督學習,并且標記這些示例的角色通常由 在線工作人員執(zhí)行,并通過諸如Amazon Mechanical Turk之類的平臺雇用。
訓練這些系統(tǒng)通常需要大量的數(shù)據(jù),有些系統(tǒng)需要搜尋數(shù)百萬個示例來學習如何有效地執(zhí)行任務-盡管在大數(shù)據(jù)和廣泛的數(shù)據(jù)挖掘時代,這越來越有可能。訓練數(shù)據(jù)集龐大且規(guī)模不斷擴大 Google的Open Images Dataset擁有約900萬張圖像,而其帶有標簽的視頻存儲庫YouTube-8M鏈接了700萬個帶有標簽的視頻。ImageNet是這類早期數(shù)據(jù)庫之一,擁有超過1400萬張分類圖像。該文件經(jīng)過兩年的編寫,由近50,000人(其中大部分是通過Amazon Mechanical Turk招募的)匯集在一起的,他們檢查,分類并標記了將近10億張候選圖片。
從長遠來看,與龐大的計算能力相比,訪問具有大量標記數(shù)據(jù)集的重要性可能不那么重要。近年來,Generative Adversarial Networks(GAN)展示了向機器學習系統(tǒng)饋送少量標記數(shù)據(jù)的方式,然后可以生成大量新鮮數(shù)據(jù)來自學。
這種方法可能會導致半監(jiān)督學習的興起,在這種情況下,系統(tǒng)可以使用遠遠少于當今使用監(jiān)督學習的訓練系統(tǒng)所需要的標記數(shù)據(jù)來學習如何執(zhí)行任務。
無監(jiān)督學習
相比之下,無監(jiān)督學習則使用另一種方法,即算法嘗試識別數(shù)據(jù)中的模式,尋找可用于對數(shù)據(jù)進行分類的相似性。
一個例子可能是將重量相似的水果或發(fā)動機尺寸相似的汽車聚集在一起。
該算法并非預先設置為挑選特定類型的數(shù)據(jù),它只是尋找可以根據(jù)其相似性進行分組的數(shù)據(jù),例如Google News每天將相似主題的故事分組在一起。
強化學習
強化學習的粗略類比是當寵物在表演把戲時獎勵其零食。
在強化學習中,系統(tǒng)嘗試根據(jù)其輸入數(shù)據(jù)最大化獎勵,基本上要經(jīng)過反復試驗的過程,直到獲得最佳結(jié)果。
強化學習的一個例子是Google DeepMind的Deep Q網(wǎng)絡,該網(wǎng)絡 已被用于在各種經(jīng)典視頻游戲中實現(xiàn)最佳人類表現(xiàn)。系統(tǒng)從每個游戲中獲取像素,并確定各種信息,例如屏幕上對象之間的距離。
通過查看每個游戲中獲得的分數(shù),系統(tǒng)會建立一個模型,該模型的動作將在不同情況下使分數(shù)最大化,例如,在視頻游戲Breakout的情況下,應將球拍移至其中以攔截球。
關于我們:
Infocode藍暢信息技術(shù)有限公司成功為多家世界財富500強企業(yè)以及其他著名品牌提供優(yōu)質(zhì)服務,是您靠譜的互聯(lián)網(wǎng)開發(fā)供應商。
服務客戶遍及北京、上海、杭州、深圳、廣州、天津、青島、南京、寧波、蘇州、無錫、廈門、重慶、西安等大中型城市及地區(qū) ? ?為您提供:H5開發(fā),小程序開發(fā),H5外包,微信開發(fā),H5商城開發(fā),小程序商城開發(fā),網(wǎng)站開發(fā)外包,H5游戲開發(fā),小程序開發(fā)外包,小程序設計、APP開發(fā)外包,UI設計,SEO優(yōu)化,SEO外包,視頻后期制作等優(yōu)質(zhì)服務

本文來自網(wǎng)絡 由藍暢整理,經(jīng)授權(quán)后發(fā)布,本文觀點不代表Infocode藍暢信息技術(shù)立場,轉(zhuǎn)載請聯(lián)系原作者。