【感想】アプリケーションエンジニアのためのApache Spark入門

新郷美紀, 今井雄太, 河村康爾, 木村宗太郎, 外賀伸治, 須田桂伍, 高木章光, 田中裕一, 森下雄貴 / 秀和システム
(2件のレビュー)

総合評価:

平均 3.5
1
0
0
1
0

ブクログレビュー

"powered by"

  • onesword0618

    onesword0618

    このレビューはネタバレを含みます

    元々、Apache Sparkの利用方法にKafkaについて言及していたので手に取りました。

    昨今、IOTの利用範囲が拡大していくなかでどのようにこの「Apache Spark」を利用しているのか農業のユースケースなどを用いて概要と使用方法について言及しています。

    読んでみて直近利用しなさそうだなと思いつつもIOT系の道具を利用する際にこのツールを利用するのは一考したいと思いました。

    レビューの続きを読む

    投稿日:2023.07.12

  • gunmake

    gunmake

    データ分析基盤(データ分析プラットフォーム)としてApache Sparkを採用し、「今井ファーム」のペグ型土壌検知センサからのストリームデータをデータ収集から最終は機械学習までのデータ処理・分析を具体的なコード共に紹介している。

    1章 データ分析プラットフォームの概要
    2章 Spackの概要
      概要、Sparkは大きなミドルウエアなので全てをこの本で紹介しているわけではない。また網羅的に紹介しているわけでもない。「今井ファーム」というユースケースをとうして必要なことをコードで説明している。またそのコードも1つ1つ詳細に説明しているわけではないので事前にPython,Flutentd,Zookeeper,Kafkaなどについても前提知識が必要。一言で言うと入門書ではない。
    3章 サンプルユースケース概要
      この本でデータ分析をするサンプルの紹介。今井ファームの概要。こんなユースケースを想定していると実業務に展開するときわかりやすい。
    4章 Flutentd,Kafkaによるデータ収集
      データ分析基盤にApache Sparkを採用しているが全てSparkでできるわけではなくFlutentd,Kafkaなどのツールも併用している。上流から下流まで全て設定してあるのがよい。
    5章 Spark Strreamingによるデータ処理
      データ収集から上がってくるストリームデータをマイクロバッチで処理していく手順を紹介
    6章 外部ストレージへのデータ蓄積
      カサンブラというデータが増えてもすばやく対応できるデータベースを採用Sparkと組み合わせて使うことが多いとか。
    7章 Spark Streamingによるデータ分析
      データが遅延、ロストすることが多いストリームデータ特有の問題に対して解決方法を提示している
    8章 Spark SQLによるデータ処理
      Jupyter、matplotlibによる前処理、探索的データ分析を紹介
    9章 Spark Mlibによるデータ分析
      Spark Mlibによる機械学習の紹介
    10章 プロダクションに向けたシステムアーキテクチャを考える
      実運用に有効な考え方を紹介


    かなりのボリューム、この1冊でSparkを理解できたとは思わないあと数冊読み込む必要があるが概要、Sparkの使いどころわかった。なかなかない中級、上級者向けの本
    続きを読む

    投稿日:2018.10.28

クーポンコード登録

登録

Reader Storeをご利用のお客様へ

ご利用ありがとうございます!

エラー(エラーコード: )

本棚に以下の作品が追加されました

追加された作品は本棚から読むことが出来ます

本棚を開くには、画面右上にある「本棚」ボタンをクリック

スマートフォンの場合

パソコンの場合

このレビューを不適切なレビューとして報告します。よろしいですか?

ご協力ありがとうございました
参考にさせていただきます。

レビューを削除してもよろしいですか?
削除すると元に戻すことはできません。