Coggle requires JavaScript to display documents.
RDD (主要屬性 (一個Partitioner
(針對key-value的RDD才有) (定義 (RDD分片函數 (種類…
RDD (主要屬性 (一個Partitioner
(針對key-value的RDD才有), 一個列表, 一組分片(Partition), RDD之間依賴關係, 一個計算每個分區函數), 情境 (數據並行批量分析應用, 不適合), 創建 (由一個已經存在Scala集合創建, 由外部儲存系統數據集, 包含本地文件系統,還有所有Hadoop支援數據集(HDFS, Cassabdra HBase, Amazon S3)), (創建後的)操作, (緩存 (存儲級別, 相對機制), 持久化), 依賴 (窄依賴
(Narrow Dependencies), 寬依賴
(Wide Dependencies )
(Shuffle Dependencies)), 比較 (數據流 data stream), what (只讀的,分區記錄集合))