ibm正試圖讓自己的watson data platform的資料訪問更容易,以便讓那些基於人工智慧的應用使用該平台。
ibm表示,watson中增加新的資料編目和精**能,將讓開發者和資料科學家更容易為ai應用準備資料和分析資料。新功能讓使用者可以更容易跨公有雲和私有雲連線和分享資料,這也是ibm擴充套件其資料治理產品的舉措之一。
ibm watson data platform是一款基於雲的服務,整合了各種工具幫助資料科學家和其他人從他們的資料中獲得智慧型,訪問ai、分析和機器學習服務。
這次公布的data catalog和data refinery工具可以幫助將不同格式、不同位置(例如雲或者本地環境中)的資料聚合到一起,使用者可以訪問到這些資料。此外這些工具還可用於清理這些資料,讓基於ai的應用可以使用這些資料。其他特點還包括能夠利用元資料標記和執行資料治理策略,確保資料的安全性。
ibm還宣布提供analytics engine,可將資料儲存與其中儲存的資訊分離開,把資料更快速地輸送給ai應用。ibm表示,這些新功能將有助於打消ai應用開發者面臨的主要障礙之一,也就是讓儲存在不同位置的複雜資料變得有意義。
更好的資料治理
對於那些正在應對資料量快速增長的企業來說,資料治理已經成為乙個日益嚴重的問題。ibm正在通過擴充套件unified governance platform來解決這個需求,該平台讓企業組織能夠更容易找到資料和分類資料。infosphere information server現在提供了對unified governance catalog的單一檢視,被用於定義通用資料描述。此外,ibm還更新了用於表和元資料服務的datastage designer工具,增加識別和建議使用模式的方法。
新推出的analytical_master data management工具提供的自助式服務可用於動態視覺化、探索和關聯資料來源。乙個名為域「同意管理」主要針對需要符合將在明年5月生效的歐盟「通用資料保護條例」(gdpr)的企業。使用者可以檢視和管理在gdpr要求中定義的各種許可過程。
ibm還公升級了industry data models,主要是考慮到了gdpr條例。這些預先設計的業務和技術資料模型可用於圍繞已經識別的資料加快商業智慧型應用的開發。這次增加了對gdpr域專有條款的支援,此外還有行業專用詞彙索引,以填補監管機構和垂直行業之間在語言上的差距。
ibm watson data platform總經理derek schoettle表示:「人工智慧的關鍵是從強大的資料基礎開始的,這將流入資料的量和速度挑戰轉變為一種資產。對於那些利用人工智慧創新和競爭的企業來說,他們需要一種方法來掌握和組織各個**的資料,將這種複雜資料索引作為每個決策和專案的支柱。」
本文出處:暢享網
計算密集型 IO密集型 資料密集型
2 計算密集型任務雖然也可以用多工完成,但是任務越多,花在任務切換的時間就越多,cpu執行任務的效率就越低,所以,要最高效地利用cpu,計算密集型任務同時進行的數量應當等於cpu的核心數。3 計算密集型任務由於主要消耗cpu資源,因此,執行效率至關重要。python這樣的指令碼語言執行效率很低,完全...
資料密集型 大資料
科學研究四大正規化 第一正規化 經驗科學 人類最早的科學研究,主要以記錄和描述自然現象為特徵,又稱為 實驗科學 經驗科學是 理論科學 的對稱,指偏重於經驗事實的描述和明確具體的實用性的科學,一般較少抽象的理論概括性。在研究方法上,以歸納為主,帶有較多盲目性的觀測和實驗。一般科學的早期階段屬經驗科學,...
資料密集型應用 筆記
可靠性,可伸縮性,可維護性 可靠性 reliability 系統在困境 adversity 硬體故障 軟體故障 人為錯誤 中仍可正常工作 正確完成功能,並能達到期望的效能水準 可伸縮性 scalability 有合理的辦法應對系統的增長 資料量 流量 複雜性 參閱 可伸縮性 可維護性 maintai...