<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能 正文
      發私信給何忞
      發送

      2

      八步拿下數據科學,攻克 “21世紀最性感的工作”

      本文作者: 何忞 2016-11-02 09:35
      導語:數據科學家被譽為“2016年最佳工作”,甚至是“21世紀最性感的工作”,學習起來真的并沒有我們想象的那么輕松。

      在數據科學(Data Science)領域,除了“什么是數據科學”這個問題以外,大家最感興趣的問題就是“如何學習數據科學?”其實這個問題除了新手會問,有時候領域內的老手也有些迷惑。

      數據科學家被譽為“2016年最佳工作”,甚至是“21世紀最性感的工作”,但學習起來真的并沒有我們想象的那么輕松。

      網絡上可以找到大量關于學習數據科學的建議,但是如此大量的信息堆疊讓可能還是讓初學者感到無所適從。所以本文想要給出一個較為簡單的學習方法:用八個步驟學習數據科學。本文的目的不在于為你提供一個詳盡的學習清單,我們只是為每一個對學習數據科學有興趣或者已經從事該領域工作但仍然想要提升自己的人們提供一個指導性意見。(另外,文中的插圖能幫助視覺型學習者更加快速地學習)

      原文作者 Karlijn Willems,雷鋒網編譯,未經許可不得轉載。

      什么是數據科學?

      數據科學這個概念目前仍然比較模糊。一直以來,跟數據科學概念相關的概念層出不窮。下圖是第一張關于“數據科學”概念的韋恩圖,由 Drew Conway 在2010年制作。圖中的中心部分是數據科學,韋恩圖表明它是黑客技術、數學、統計學和其他實質性的專業知識的組合。

      八步拿下數據科學,攻克 “21世紀最性感的工作”

      多年來,關于數據科學領域的概念韋恩圖非常多,并且越做越好。如果你想查看關于這個方面的詳細歷史,這里有一篇文章可以關注:Battle of the Data Science Venn Diagrams。但是最近,對這個概念的討論又有了新的進展。2016年,Gregory Piatetsky-shapiro 制作了一個不同的概念圖,其中有兩點最引人注目:數據科學不再處于圖的中心位置;并且他定義數據科學的方法也有所不同。最新的研究室是利用數據科學與其他學科(如人工智能、機器學習、深度學習、大數據、數據挖掘)的關系來對其進行定義。由此得出的定義是,數據科學是人工智能、機器學習和大數據的交集,并與數據挖掘有著本質性聯系,它是數據挖掘的擴展集和后繼術語。

      這兩個圖示可能看起來完全不同,但是它們的確有很多相似之處:Piatetsky-shapiro 的圖示也運用了 Drew Conway 的韋恩圖中的黑客技術、數學、統計學和其他實質性的專業知識。

      數據科學家的教育背景

      過去幾年中,有很多關于數據科學家教育背景的調查,調查的結果也不盡相同。2014 年的 O' Reilly 數據科學家薪酬調查中,大約 28%的受訪者擁有學士學位,44%擁有研究生學位,20% 擁有博士學位。數據科學家們普遍有著數學/統計學、計算機、工程的學科背景。下圖是 2016 年的調查結果,與 O' Reilly 的調查結果非常接近。

      八步拿下數據科學,攻克 “21世紀最性感的工作”

      通常來說,你可以從調查中看到,數據科學家的普遍教育程度是碩士和博士。學科領域并不是十分重要,但是定量研究類的學科背景仍有一定優勢。

      第一步:學好統計學、數學和機器學習

      雖然數據科學的定義在不斷地改變,但是數據科學仍然是一種技術型學科。對統計學、數學和機器學習的良好知識基礎仍然是對數據科學家這一行業的基本要求。

      學好這三門課是非常痛苦的,尤其是對于那些沒有技術背景的人。但幸運的是,有很多高質量的資源可以幫助你學習:Khan Academy 有十分多樣化的在線數學課程,你會由此受益良多;同時,別忘了在 MIT Open Courseware 上學習線性代數課程;機器學習部分,你可以參考DataCamp Stanford Online Coursera

      第二步:學習編程

      提升你的編程技巧也是學習數據科學的必經之路。

      你可以從熟悉計算機的基本知識開始,了解基礎的數據結構和搜索算法,明白端到端的工作流程。因為數據科學家的工作需要與其他系統相結合,所以最好能夠明白從需求收集到分析,再到測試、維護的整個過程是如何進行的。當你掌握了這些概念后,就應該開始選擇一種編程語言。你可以選擇開源語言或者收費版的語言,選擇的考量在于學習語言的時間長短、你想要進入的行業的要求、語言的性價比等等。下圖可以幫助你選擇適合你的語言。

      八步拿下數據科學,攻克 “21世紀最性感的工作”

      第三步:學習數據庫

      當你開始學習數據科學時,你會發現很多教程將重點放在從非二進制文件中檢索數據的技巧。然而,當你開始工作或進入行業內部時,你會發現絕大多數的工作是與一個或多個數據庫相關聯的。

      市面上有很多種數據庫。企業可能使用的是商業版的數據庫(比如 Oracle),或者更傾向于開源的數據庫。在眾多數據庫中學習的關鍵在于明白數據庫是如何運作的,學習數據庫的原理、工作過程和輸出結果。其中最應掌握的概念是關系數據庫管理系統(RDBMS)和數據倉庫。你應該充分學習關系型建模和維度建模方法,學習 SQL 和抽取、轉換、裝載的過程(ETL)。

      如果你想要學習數據庫,你可以查看Mongo DB UniversityStanford Online 的在線課程 Introduction to DatabasesDataStaxTutorialsPoint 上的教程。

      第四步:探索數據科學家的工作流程

      學習的下一步就是了解數據科學的工作流程。很多指導教程和課程僅僅關注其中的一個或者兩個部分,并沒有對這個工作流程提供一個完整的視角,而對整個工作流程的宏觀了解卻是你今后成為數據科學家或是在數據組中工作時必須掌握的。其中很重要的問題是,不能忘記數據科學家的工作是一個需要不斷迭代的過程。

      對已經學會編程的數據科學的入門者來說,了解工作流程最簡單的方法就是練習你的編程技巧,用 R 語言或者 Python 語言來開始練習,學習使用數據包和數據庫來簡化你的編程過程。

      八步拿下數據科學,攻克 “21世紀最性感的工作” 

      對于那些編程技巧不夠的初學者,你可以利用開源的工具,因為它不需要你的任何編程技能。這些工具可以使你在同一時間完成數據科學工作流程中的多步工作。比如,RapidMiner 可以對你的數據進行收集、標出重點、清潔數據、建模、評估等等。應該注意的一點是,你可以去使用這些工具,但是你仍然需要繼續提升你的編程技術。

      第五步:大數據進階

      很多人在學習的時候過分關注數據科學的基本知識,而忘記了其宏觀的結構概念。在之前的步驟中已經對此有一些提示,但是這里仍然有一個矛盾,比如就像你在學習教程時重點關注的是非二進制的文件但是在實際工作使用中卻更多需要數據庫。更重要的一個問題在于數據的更新速度、多樣性和數據量都是明明白白地擺在那里的,我們不可能忽略這些。

      大數據或許是有些夸大的說法,但是它的確存在,并且認識它,明白它的深刻含義是非常重要的。其中三個最最需要了解的關于大數據的內容是:

      1、明白為什么大數據需要不同的數據處理方法?這里最好的學習方法可能是查找使用大數據的案例,比如 點擊這里

      2、熟悉分布式系統基礎架構 Hadoop 的模型,因為它被廣泛用于數據的分配存儲和處理,詳見Hadoop

      3、不要忘記了 Spark框架。你可以嘗試用 Python 或 Scala 語言來學習 Spark,這樣你既練習了編程技術,也擴展了對數據科學的視野,一舉兩得。

      第六步:成長,交流,學習

      成長。如果你已經成功掌握了之前所說的一些基礎知識,接下來就是成長提升的階段了。你要通過各種數據科學方面的問題來不斷地練習,努力將學習的原理應用到實踐中。同時,你也應該從中增強自己在該領域的直覺感。練習題目看這里:KaggleDrivenData

      溝通。作為一個數據科學的初學者,你可能在學習中遇到過很多問題和困惑。你應當多于該領域有經驗的人溝通交流,與他們討論你的問題,向他們尋求幫助和建議。這些人會激勵你繼續學習,鞭策你走的更遠。

      學習。持續性的學習和數據科學也許是一對同義詞。上文提到的Kaggle 和 DrivenData 可以教會你如何在實踐中進行數據處理,但是你還可以在自己的日常生活中把知識運用的更深入。

      第七步:完全將自己沉浸其中

      就像學習語言需要語言環境一樣,學習數據科學也需要這種能夠沉浸其中的環境。根據你已有的能力和知識,你可能會考慮參加集訓營,找實習,或者找相關工作。參加集訓營是一種快速提高能力的方法,同時也可以收獲志同道合的朋友,擴展你的人際圈。尋找集訓營,請點擊 GalvanizeMetis

      其次,如果你已經熟練掌握了數據科學的基本知識,你可以考慮找一個實習崗位。很多大公司(如 Facebook、Quora和亞馬遜)都在尋找相關實習生,你可以從實習崗位開始對該領域的深入探索。你還可以從你的社交網絡渠道中尋找開放的職位和實習信息。最后,你也可以關注創業企業,小公司也許可以讓你學到更多。AngelList里有一些初創企業的招聘信息。

      最后一種沉浸其中的方法是找相關工作,然而很多初學者在這里遇到了瓶頸。也許你對數據科學家的工作十分感興趣,但是在找工作的時候一定要牢記以下內容:

      • 1、工作職位并不是總是符合其定位。他們也許貼出尋找“數據科學家”的招聘信息,但實際上是在尋找數據工程師或者商業分析師。查看這篇文章 The Data Industry: Who Does What,你可以了解到企業究竟在招聘時要什么崗位。

      • 2、正確設定你的期望。如果你沒有數據科學家、數據庫或端對端方面的工作經歷,直接申請數據科學家或分析師的職位是不現實的。請確保在申請時具備相關工作經歷。不要因為無法立刻找到工作而氣餒。相反,你應該保持學習,提升能力,并持續關注企業的招聘信息。

      第八步:與時俱進

      最后這一步有時候經常被大家遺忘。即是你已經在從事數據科學方面的工作,你也應該時刻牢記,數據科學需要持續地學習。這個領域總有新的進步,所以保持對周邊事物的好奇心和信息靈敏度非常重要。所以不要忘記時常閱讀社會媒體的評論報道,追蹤行業大牛動態,總之就是要與時俱進。

      數據科學領域的最新新聞,你可以從這些地方獲取:KD NuggetsData ElixirData Science Weekly。行業大牛的推特也要經常查閱,比如: DJ PatilAndrew NgBen Lorica

      你還可以加入一些在線社區,及時與同行溝通。

      • 比如 LinkedIn中的“大數據”、“分析學”、“商務智能”、“大數據分析”、“數據科學家”、數據挖掘、統計、大數據、數據可視化、數據科學“等等群組。

      • 還有 Facebook 上的“數據科學入門”、“分析學”、“機器學習”、“數據挖掘”、“R語言”、“Python”等等群組。

      • Subeddits中還有一些“R/數據科學”、“R/stats”、“R/Python”等群組。

      Via Kdnuggets

      推薦閱讀:

      IBM 和 Slack 強強聯手,開發更智能的數據分析聊天機器人

      那些年 AI 預測過的事情最后都說對了嗎?

      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

      八步拿下數據科學,攻克 “21世紀最性感的工作”

      分享:
      相關文章

      編輯

      站在博士路的路口。
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 大香蕉久久综合| 三级国产三级在线| 久久精品女人天堂av| 天天拍夜夜添久久精品大| 国产乱子伦一区二区三区四区五区| 中文字幕日韩精品无码内射| 极品粉嫩嫩模大尺度无码视频| 超碰色偷偷男人的天堂| а∨天堂一区中文字幕 | 91私拍| 加查县| 非洲黑人最猛性xxxx交| 日韩偷拍视频一区二区三区| 亚洲免费三区| 亚洲午夜香蕉久久精品| 亚洲欧美精品狠狠干| 久久99精品久久久久麻豆| 国产成年无码久久久久毛片| 九九热在线免费播放视频| 亚洲第一成人无码A片| 丰满熟女乱婬A片六区| 亚洲欲妇| 国产精品美女久久久久久麻豆| 漂亮人妻被中出中文字幕| 亚洲色欲久久久久综合网| 久久国产精品_国产精品| 亂倫近親相姦中文字幕| 国产精品v片在线观看不卡| 国产欧美日韩精品丝袜高跟鞋| 制服丝袜亚洲无码| 国产黄片视频在线| 国产AV无码专区亚洲AV漫画| 亚洲VA中文字幕无码毛片| AV色色色| 亚洲国产另类久久久精品网站| 免费黄色在线| 蜜桃av亚洲精品一区二区| 男女裸体做爰爽爽全过| 杨浦区| 久久久一本波多野结衣| 欧洲成人综合|