読書会(データ指向アプリケーションデザイン)第8回議事録
[ 戻る ]
=================================================================
Java読書会BOF「データ指向アプリケーションデザイン」を読む会 第8回
=================================================================
.. csv-table:: 開催概要
"日時", "2021年5月29日 10:00 - 17:00"
"場所", "てくのかわさき 第4研修室"
"出席者(敬称略)", "松永、平山、岩室、加藤、遠藤、高橋(智)、高橋(徹)、吉本"
* 本日は、p.433 の 10.1.2.1から読書開始です。
10章 バッチ処理
====================
----------------
10.1 Unix のツールによるバッチ処理
----------------
10.1.2 Unix の哲学
----------------
10.1.2.2 ロジックと結線の分離
````````````````````````````````````````
* plan9は分散OS
----------------
10.2 MapReduce と分散ファイルシステム
----------------
* イレージャーコーディングって何?
* 符号化だろう
10.2.1 MapReduce ジョブの実行
----------------
10.2.1.1 MapReduce の分散実行
````````````````````````````````````````
*図10-1 m1やr1は何?
* パーティションを表している?
* r1がキーか?
* m1,r1で複合キーなのか?
* reducerの動き出すタイミングは?
* すべてのマッパーが終わってから?
* それとも一つのマッパーが終わってから?
* どっちなのかは宿題
10.2.2 Reduce 側での結合とグループ化
----------------
10.2.2.2 ソートマージ結合
````````````````````````````````````````
* ソートマージ結合
* 通常のデータベースにくらべてのメリットは、並列化・スケーラビリティ
* ただしデータの取り込みが事前に必要になる
* データが増えたときは最初からやりおし?
* hadoop入れても難しすぎて使えない
* 前に読んだhadoop本は
* 哲学のような部分はあまり書いてなかったような
11賞 ストリーム処理
====================
* 遅延リストとは何か?
* 無限リストのこと?
* P491 図11-3 サブスクライブする対象はトピックなのか?パーティションをなのか?
次回はP500 11.2.3 イベントソーシングから
[ 戻る ]