読書会(データ指向アプリケーションデザイン)第8回議事録

[ 戻る ]


=================================================================
Java読書会BOF「データ指向アプリケーションデザイン」を読む会 第8回
=================================================================

.. csv-table:: 開催概要

  "日時", "2021年5月29日 10:00 - 17:00"
  "場所", "てくのかわさき 第4研修室"
  "出席者(敬称略)", "松永、平山、岩室、加藤、遠藤、高橋(智)、高橋(徹)、吉本"


* 本日は、p.433 の 10.1.2.1から読書開始です。


10章 バッチ処理
====================

----------------
10.1 Unix のツールによるバッチ処理
----------------

10.1.2 Unix の哲学
----------------

10.1.2.2 ロジックと結線の分離
````````````````````````````````````````

* plan9は分散OS


----------------
10.2 MapReduce と分散ファイルシステム
----------------

* イレージャーコーディングって何?
  * 符号化だろう


10.2.1 MapReduce ジョブの実行
----------------

10.2.1.1 MapReduce の分散実行
````````````````````````````````````````

*図10-1 m1やr1は何?
  * パーティションを表している?
  * r1がキーか?
  * m1,r1で複合キーなのか?

* reducerの動き出すタイミングは?
  * すべてのマッパーが終わってから?
  * それとも一つのマッパーが終わってから?
    * どっちなのかは宿題

10.2.2 Reduce 側での結合とグループ化
----------------

10.2.2.2 ソートマージ結合
````````````````````````````````````````

* ソートマージ結合
  * 通常のデータベースにくらべてのメリットは、並列化・スケーラビリティ
  * ただしデータの取り込みが事前に必要になる
  * データが増えたときは最初からやりおし?
    * hadoop入れても難しすぎて使えない
    

* 前に読んだhadoop本は
  * 哲学のような部分はあまり書いてなかったような


11賞 ストリーム処理
====================

* 遅延リストとは何か?
  * 無限リストのこと?

* P491 図11-3 サブスクライブする対象はトピックなのか?パーティションをなのか?

次回はP500 11.2.3 イベントソーシングから


[ 戻る ]