0

雷鋒網消息,在昨日圣何塞舉行的 Strata+Hadoop World 大會上,美國大數據服務商 Cloudera 發布了 Cloudera Data Science Workbench —— 一個運行于 Cloudera Enterprise,自助式的數據科學開發環境。目前該全新研發的軟件尚在 beta 內測階段。
雷鋒網獲知,相關技術來自于 Cloudera 去年收購的數據科學初創公司 Sense.io。該產品的最大特點是原生支持 Apache Spark、Hadoop 和 R、Python、Scala 等開發語言。 開發者能在 Cloudera 的企業平臺上同時使用這些工具和語言,這將加速數據分析項目從研發到最終產品的過程。
Cloudera 高級副總裁 Charles Zedlewski 表示:
“Cloudera 專注于提升數據科學和工程團隊的使用體驗,尤其是想要用 Spark 來協助數據處理和機器學習,來對分析任務進行擴展的用戶。對 Sense.io 的收購,以及其團隊的加入,為該產品提供了牢固的基石。Data Science Workbench 向我們的客戶,提供了開展大規模自助式數據科學工作的能力。”

Charles Zedlewski (中)
那么,Cloudera Data Science Workbench 具體能夠帶來什么?
對于數據科學家:
能在多個開源軟件庫和框架上使用 R, Python 和 Scala。可以直接在瀏覽器使用。
使用 Spark 和 Impala,能直接從十分安全的 Hadoop 數據簇獲取數據。
與團隊分享經驗。
對于 IT 管理者:
給你的數據科學團隊更高的工作靈活性
服從完整的 Hadoop 安全方案,尤其是 Kerberos
既能在本地運行,也能在云端。
現在,正是數據科學開源浪潮一浪高過一浪,不但席卷 Python 和 R語言生態,還吸納進各個深度學習框架(比如 Tensorflow、Microsoft Cognitive Toolkit、MXnet、BigDL 等)的時候。數據科學團隊需要將這些工具應用于 Hadoop 環境下的數據。Cloudera Data Science Workbench 便是為此而設計。
雷鋒網消息,在大會上 Charles Zedlewski 進一步解釋道:
“我們的 IT 企業客戶往往對于怎么讓數據科學家在分享環境下工作十分頭疼。這是由于,數據科學家們的需求十分多樣,尤其是涉及到開源工具。這經常導致重復工作、有限的安全性和管理,以及 analytic silos。同時,數據科學家一直在尋找,把他們的工作擴展到更大的數據集和更強大計算平臺上的方法。通過 Data Science Workbench,Cloudera 幫助 IT 團隊和數據科學家相互協作,把更多用戶帶到共享的環境中。我們的方案既保證靈活性,又在關鍵的安全環節不妥協。”
詳情:https://www.cloudera.com/products/data-science-and-engineering/data-science-workbench.html
via globe news wire
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。