日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長提供免費收錄網(wǎng)站服務(wù),提交前請做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

21 個必須知道的機器學(xué)習(xí)開源工具

作者 | SebastianScholl

譯者 | 劉靜,責(zé)編 | 郭芮

出品 | CSDN(ID:CSDNnews)

以下為譯文:

你肯定已經(jīng)了解流行的開源工具,如R、Python、Jupyter筆記本等。但是,除了這些流行的工具之外還有一個世界——一個隱藏在機器學(xué)習(xí)工具下的地方。這些并不像他們的同行那樣出色,但可以成為許多機器學(xué)習(xí)任務(wù)的救星。

21 個必須知道的機器學(xué)習(xí)開源工具

在本文中,我們將介紹21種用于機器學(xué)習(xí)的開源工具。我強烈建議你花一些時間瀏覽我提到的每個類別。除了我們通常在課程和視頻中學(xué)到的東西之外,還有很多需要學(xué)習(xí)的地方。

1.向非程序員的開源機器學(xué)習(xí)工具

對于來自非編程和非技術(shù)背景的人來說,機器學(xué)習(xí)看起來很復(fù)雜。這是一個廣闊的領(lǐng)域,我可以想象第一步可能會多么令人生畏。沒有編程經(jīng)驗的人能否在機器學(xué)習(xí)中取得成功?

事實證明,你可以!這里有一些工具可以幫助你跨越鴻溝并進入著名的機器學(xué)習(xí)世界:

  • 優(yōu)步路德維希:路德維希允許我們訓(xùn)練和測試深度學(xué)習(xí)模型,而無需編寫代碼。您需要提供的只是一個包含數(shù)據(jù)的CSV文件,一個用作輸入的列的列表,以及一個用作輸出的列的列表——Ludwig將完成剩下的工作。

  • KNIME:KNIME允許您使用拖放界面創(chuàng)建整個數(shù)據(jù)科學(xué)工作流程。這種可視化實現(xiàn)整個模型工作流的方法非常直觀,在處理復(fù)雜的問題陳述時非常有用。

21 個必須知道的機器學(xué)習(xí)開源工具
  • Orange:您不必知道如何編碼以便能夠使用Orange挖掘數(shù)據(jù),處理數(shù)據(jù)并獲得洞察力。

有許多有趣的免費和開源軟件可以提供很好的機器學(xué)習(xí)功能,而無需編寫(大量)代碼。

另一方面,你可以考慮一些開箱即用的付費服務(wù),例如google AutoML、Azure Studio、Deep Cognition和Data Robot。
 

2.用于模型部署的開源機器學(xué)習(xí)工具

部署機器學(xué)習(xí)模型是最容易被忽視但重要的任務(wù)之一,它幾乎肯定會在采訪中出現(xiàn),所以你可能也很熟悉這個話題。

以下是一些框架,可以更輕松地將你的項目部署到現(xiàn)實世界的設(shè)備中。

  • MLFlow:MLFlow被設(shè)計用于使用任何機器學(xué)習(xí)庫或算法,并管理整個生命周期,包括實驗、重現(xiàn)性和機器學(xué)習(xí)模型的部署。

21 個必須知道的機器學(xué)習(xí)開源工具
  • Apple的CoreML:CoreML是一個流行的框架,它可用于將機器學(xué)習(xí)模型集成到你的IOS / Apple Watch / Apple TV / macOS應(yīng)用程序中。關(guān)于CoreML的最好的部分是你不需要有關(guān)神經(jīng)網(wǎng)絡(luò)或機器學(xué)習(xí)的廣泛知識,雙贏!

21 個必須知道的機器學(xué)習(xí)開源工具
  • TensorFlow Lite:TensorFlow Lite是一組工具,可幫助開發(fā)人員在移動設(shè)備(Android和iOS),嵌入式和物聯(lián)網(wǎng)設(shè)備上運行TensorFlow模型。

  • TensorFlow.JS - TensorFlow.JS可以成為你在網(wǎng)絡(luò)上部署機器學(xué)習(xí)模型的首選。它是一個開源庫,可讓你在瀏覽器中構(gòu)建和訓(xùn)練機器學(xué)習(xí)模型。

21 個必須知道的機器學(xué)習(xí)開源工具
 

適用于大數(shù)據(jù)的開源機器學(xué)習(xí)工具

大數(shù)據(jù)是一個研究如何分析、系統(tǒng)地從數(shù)據(jù)集中提取信息,或者處理傳統(tǒng)數(shù)據(jù)處理應(yīng)用軟件無法處理的太大或太復(fù)雜的數(shù)據(jù)集的領(lǐng)域。想象一下,每天處理數(shù)百萬條推文進行情感分析。這是一項艱巨的任務(wù),不是嗎?

別擔(dān)心!這里有一些工具可以幫助你處理大數(shù)據(jù)。

  • Hadoop:使用大數(shù)據(jù)最重要和最相關(guān)的工具之一是Hadoop項目。Hadoop是一個框架,它允許使用簡單的編程模型跨計算機集群分布式處理大型數(shù)據(jù)集。

21 個必須知道的機器學(xué)習(xí)開源工具
  • Spark:Apache Spark被認為是Hadoop用于大數(shù)據(jù)應(yīng)用程序的自然繼承者。這個開源大數(shù)據(jù)工具的關(guān)鍵點在于它填補了Apache Hadoop在數(shù)據(jù)處理方面的空白。有趣的是,Spark可以處理批量數(shù)據(jù)和實時數(shù)據(jù)。

  • Neo4j:對于所有與數(shù)據(jù)相關(guān)的大問題,Hadoop可能不是明智的選擇。例如,當你需要處理大量網(wǎng)絡(luò)數(shù)據(jù)或圖形相關(guān)問題(如社交網(wǎng)絡(luò)或人口統(tǒng)計模式)時,圖形數(shù)據(jù)庫可能是最佳選擇。

21 個必須知道的機器學(xué)習(xí)開源工具

4.用于計算機視覺,NLP和音頻的開源機器學(xué)習(xí)工具

“如果我們想要機器思考,我們需要教他們看。”——Fei-Fei Li博士的計算機視覺。

  • SimpleCV:如果你從事任何計算機視覺項目,必須使用OpenCV。但你有遇到過SimpleCV嗎?SimpleCV可以訪問幾個高性能的計算機視覺庫,如OpenCV——無需首先了解位深度、文件格式、色彩空間、緩沖區(qū)管理、特征值或矩陣與位圖存儲,這使計算機視覺變得簡單。

21 個必須知道的機器學(xué)習(xí)開源工具
  • Tesseract OCR:你是否使用過創(chuàng)意應(yīng)用程序,通過使用智能手機的相機掃描文檔或購物賬單,或者僅僅通過給支票拍照就可以把錢存入銀行賬戶?所有這些應(yīng)用程序都稱之為OCR或光學(xué)字符識別軟件。Tesseract就是這樣一種OCR引擎,能夠識別100多種語言,也可以訓(xùn)練識別其他語言。

  • Detectron:Detectron是Facebook AI Research的軟件系統(tǒng),它實現(xiàn)了最先進的物體檢測算法,包括Mask R-CNN。它是用Python編寫的,由Caffe2深度學(xué)習(xí)框架提供支持。

21 個必須知道的機器學(xué)習(xí)開源工具
  • StanfordNLP:StanfordNLP是一個Python自然語言分析包,關(guān)于這個庫的最好的部分就是它支持超過70種人類語言!

21 個必須知道的機器學(xué)習(xí)開源工具
  • BERT即服務(wù):你們所有的NLP愛好者都會聽說過BERT這一來自谷歌的突破性NLP架構(gòu),但你可能還沒有遇到過這個非常有用的項目。Bert-as-a-service使用BERT作為句子編碼器,并通過ZeroMQ將其作為服務(wù)托管,允許你僅用兩行代碼將句子映射到固定長度的表示形式。

  • Google Magenta:此庫提供了用于處理源數(shù)據(jù)(主要是音樂和圖像)的實用程序,使用此數(shù)據(jù)來訓(xùn)練機器學(xué)習(xí)模型,最后從這些模型生成新內(nèi)容。

  • LibROSA:LibROSA是一個用于音樂和音頻分析的Python包。它提供了創(chuàng)建音樂信息檢索系統(tǒng)所需的構(gòu)建塊。當我們使用深度學(xué)習(xí)等語音到文本的應(yīng)用程序時,它在音頻信號預(yù)處理中被大量使用。



  •  

5.用于強化學(xué)習(xí)的開源工具

當談到機器學(xué)習(xí)時,RL是最近的熱門話題。強化學(xué)習(xí)(RL)的目標是培養(yǎng)能夠與環(huán)境互動并解決復(fù)雜任務(wù)的智能代理,實現(xiàn)機器人、自動駕駛汽車等領(lǐng)域的實際應(yīng)用。以下是一些對RL最有用的培訓(xùn)環(huán)境:

  • 谷歌研究足球:谷歌研究足球環(huán)境是一個新穎的RL環(huán)境,代理商的目標是掌握世界上最受歡迎的運動——足球。這種環(huán)境為你提供了大量的控制來訓(xùn)練RL代理。

  • OpenAI Gym:Gym是一個用于開發(fā)和比較強化學(xué)習(xí)算法的工具包。它支持教學(xué)代理從步行到玩乒乓球或彈球戲等游戲。在下面的gif圖片中,你可以看到一個正在學(xué)習(xí)走路的機器人。

21 個必須知道的機器學(xué)習(xí)開源工具
  • Unity ML代理:Unity機器學(xué)習(xí)代理工具包(ML-Agents)是一個開放源碼Unity插件,可以將游戲和模擬作為培訓(xùn)智能代理的環(huán)境。通過一個簡單易用的Python API,可以使用強化學(xué)習(xí)、模仿學(xué)習(xí)、神經(jīng)進化或其他機器學(xué)習(xí)方法來訓(xùn)練agent。

21 個必須知道的機器學(xué)習(xí)開源工具
  • Malmo項目:Malmo平臺是一個基于Minecraft構(gòu)建的復(fù)雜AI實驗平臺,旨在支持人工智能的基礎(chǔ)研究,由Microsoft開發(fā)。

6.最后指出

正如上面的一組工具可以明顯看出,當我們考慮數(shù)據(jù)科學(xué)和人工智能相關(guān)的項目時,開源是一條正確的道路。我可能只是觸及了冰山一角,但是有許多工具可用于各種任務(wù),使你作為數(shù)據(jù)科學(xué)家的生活更輕松,你只需要知道在哪里查找即可。

你認為哪些工具應(yīng)該列在這個清單上?在下面寫下你的最愛,以便社區(qū)了解!

原文:https://medium.com/analytics-vidhya/21-must-know-open-source-tools-for-machine-learning-you-probably-arent-using-but-should-f605b94d9b06

本文為 CSDN 翻譯,轉(zhuǎn)載請注明來源出處。

【END】

分享到:
標簽:機器 學(xué)習(xí)
用戶無頭像

網(wǎng)友整理

注冊時間:

網(wǎng)站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨大挑戰(zhàn)2018-06-03

數(shù)獨一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運動步數(shù)有氧達人2018-06-03

記錄運動步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績評定2018-06-03

通用課目體育訓(xùn)練成績評定