新刊・予約
ランキング
セール
特集・キャンペーン
ジャンル一覧
詳細検索
0
新郷美紀, 今井雄太, 河村康爾, 木村宗太郎, 外賀伸治, 須田桂伍, 高木章光, 田中裕一, 森下雄貴 / 秀和システム (2件のレビュー)
レビューを書く
総合評価:
"powered by"
onesword0618
このレビューはネタバレを含みます
元々、Apache Sparkの利用方法にKafkaについて言及していたので手に取りました。 昨今、IOTの利用範囲が拡大していくなかでどのようにこの「Apache Spark」を利用しているのか農業のユースケースなどを用いて概要と使用方法について言及しています。 読んでみて直近利用しなさそうだなと思いつつもIOT系の道具を利用する際にこのツールを利用するのは一考したいと思いました。
投稿日:2023.07.12
gunmake
データ分析基盤(データ分析プラットフォーム)としてApache Sparkを採用し、「今井ファーム」のペグ型土壌検知センサからのストリームデータをデータ収集から最終は機械学習までのデータ処理・分析を具…体的なコード共に紹介している。 1章 データ分析プラットフォームの概要 2章 Spackの概要 概要、Sparkは大きなミドルウエアなので全てをこの本で紹介しているわけではない。また網羅的に紹介しているわけでもない。「今井ファーム」というユースケースをとうして必要なことをコードで説明している。またそのコードも1つ1つ詳細に説明しているわけではないので事前にPython,Flutentd,Zookeeper,Kafkaなどについても前提知識が必要。一言で言うと入門書ではない。 3章 サンプルユースケース概要 この本でデータ分析をするサンプルの紹介。今井ファームの概要。こんなユースケースを想定していると実業務に展開するときわかりやすい。 4章 Flutentd,Kafkaによるデータ収集 データ分析基盤にApache Sparkを採用しているが全てSparkでできるわけではなくFlutentd,Kafkaなどのツールも併用している。上流から下流まで全て設定してあるのがよい。 5章 Spark Strreamingによるデータ処理 データ収集から上がってくるストリームデータをマイクロバッチで処理していく手順を紹介 6章 外部ストレージへのデータ蓄積 カサンブラというデータが増えてもすばやく対応できるデータベースを採用Sparkと組み合わせて使うことが多いとか。 7章 Spark Streamingによるデータ分析 データが遅延、ロストすることが多いストリームデータ特有の問題に対して解決方法を提示している 8章 Spark SQLによるデータ処理 Jupyter、matplotlibによる前処理、探索的データ分析を紹介 9章 Spark Mlibによるデータ分析 Spark Mlibによる機械学習の紹介 10章 プロダクションに向けたシステムアーキテクチャを考える 実運用に有効な考え方を紹介 かなりのボリューム、この1冊でSparkを理解できたとは思わないあと数冊読み込む必要があるが概要、Sparkの使いどころわかった。なかなかない中級、上級者向けの本続きを読む
投稿日:2018.10.28
ポイントが追加されました。ポイント明細ページからご確認いただけます。
クーポンコードの形式が正しくありません。半角英数12桁で入力してください。
エラー(エラーコード: )
本棚を開くには、画面右上にある「本棚」ボタンをクリック
スマートフォンの場合
パソコンの場合
このレビューを不適切なレビューとして報告します。よろしいですか?
ご協力ありがとうございました 参考にさせていただきます。
レビューを削除してもよろしいですか? 削除すると元に戻すことはできません。