この作品のレビュー
平均 3.1 (58件のレビュー)
-
中味のない本
新聞の記事のように、表面的な浅い知識を並べているだけです。勉強にならないと思います。
投稿日:2014.04.05
-
数式を使わないデータマイニング入門
隠れた法則を発見する
著:岡嶋 裕史
紙版
光文社新書 255
統計分析は、情報が高コストであった時代に確立された学問体系です
それは、できるだけ小さい情報量か…ら、世界の姿を知ろうとする試みだと換言できます
一方、現代は巷に情報があふらかえっています
その差が指し示すのは、分析対象が深度を増すことであり、従来は分析対象にしなかった/できなかった情報も対象にできる
すなわち、対象の幅が広がることでもあります
本書は、社会システムの運用に欠かせない存在となったデータマイニングがどのようなものなのか、概要を説明する入門書です
気になったのは以下です
・データマイニングは行為の総称であって、そこで行われる分析手法は複数存在し、分析目的によって選択される
回帰分析
決定木分析
クラスタ分析
ニューラルネットワーク
・データマイニングでは、圧倒的な情報量を用いて分析を行う
・従来型の統計分析の弱点の一つに、分析を思い立ってからデータを収集しはじめなければ、ならない点があった
その過程で情報のスクリーニングが行われるし、そもそも情報収集に時間がかかり、タイムラグが発生してしまう
・すぐに役立つ情報でさえ保存できないのに、いつ役立つかもわからない情報を残しておく余裕はないのである
しかし、社会の急速な情報化によって情報機器がくまなく普及し、情報の保存コストは幾何級数的に低下した
一見無駄と思える情報を電子媒体上に取っておく余裕ができた
・こうして、企業をはじめ各組織体には、すぐに役立つか分からない情報、が蓄積されはじめた
・予測もしなかったデータ蓄積の増大は、分析家には朗報となった
すなわち、自由に使える情報が飛躍的に増大し、しかも、それをリアルタイムで入手できるようになったのである
・情報量と演算能力は車の両輪であり、どちらが欠けても適切な情報の利用ができないが、現代はその両方を安価に入手できる時代である
・従来型の統計分析が、規定した法則の事後検証を指向しているのに対し、データマイニングは多分に未来予測指向である
これも、利用できる情報の量と質が向上したことが大きい
・データマイニングにおけるマイニングは2段階のプロセスに分かれる
①大量の情報から隠れた法則を見つけ出すこと
②そこで見つかった法則のなかから、使えるものを探し出すこと
・さらに注意しておかなければならないのは、データマイニングはどんな局面にどのような法則が存在しているかを発見してくれはするものの、その原因を説明してはくれないことだ
・売れ筋商品と死に筋商品を峻別することで、不良在庫と欠品をなくす
・データウェアハウスの構築は、データマイニングの最初の一歩である
・ただ存在していればよいというものではない
きちんと整理され、すぐに取り出せる状態に維持しておく必要がある
・チラシをまく場所を変更したり、駐車場を拡充して顧客の定着をはかるなどの手段を講じることができる
・データの集め方
①行いたいデータマイニング用に、データを収集する
②現状で持っているデータを、データマイニング用に転用する
・そもそも、データ南下取っていない、という組織や人はとっても多いのである
・一般的にデータマイニングを行う場合、いかに多くのデータを取り込むかに意識が傾注される
それももちろん正しいのだが、どこで見切りをつけるのかも、同様に重要であることを理解しておきたい
・何が必要で何が不要なのかは、データマイニングを行う際の永遠のテーマである
・データマイニングは、おびただしい情報のなかから規則や法則を見つけ出してくれるが、そのほとんどは、役に立たない法則か、意味のない法則だと考えておいた方がよい
・各分析手法の得意な局面は、おおむね次のとおりである
分類 クラスタ分析、決定木分析、自己組織化マップ
関連発見 連関規則
予測 回帰分析、ニューラルネットワーク
・決定木を育てすぎると過学習になる
育ちすぎた決定木は、情報に過敏に反応してしまい、かえって正確な予測ができなくなってしまうことがある
・分けることは分かること
・先生が教えてくれるのが、教師あり分類
自分で考えるのが、教師なし分類
・クラスタ分析:あるデータのなかから、意味ありげなまとまりを見つけ出し、グループ化すること
・連関規則 Aが起こると、Bが発生する
Aの方を、ルールヘッド
Bの方を、ルールボディ と呼ぶ
・OECDプライバシガイドラインは、次の8原則から構成されている
①収集制限の原則
②データ内容の原則
③目的明確化の原則
④利用制限の原則
⑤安全保護の原則
⑥公開の原則
⑦個人参加の原則
⑧責任の原則
・情報を保有することが資産ではなく、リスクになってしまった
目次
まえがき
第1章 隠れた法則を見つける技法
第2章 ビジネスで使われるデータマイニング
第3章 データマイニングの手順
第4章 落としどころを探る―回帰分析
第5章 効率的に判断する―決定木
第6章 分けることは分かること―クラスタ分析
第7章 複雑な分類―自己組織化マップ
第8章 買い物かごの中身は?―連関規則
第9章 神経をまねしてみる―ニューラルネット
第10章 データマイニングと情報管理
第11章 監視社会とデータマイニング
参考文献
ISBN:9784334033552
出版社:光文社
判型:新書
ページ数:216ページ
定価:700円(本体)
発売日:2006年05月20日初版第1刷続きを読む投稿日:2024.05.10
新刊自動購入は、今後配信となるシリーズの最新刊を毎号自動的にお届けするサービスです。
- ・発売と同時にすぐにお手元のデバイスに追加!
- ・買い逃すことがありません!
- ・いつでも解約ができるから安心!
※新刊自動購入の対象となるコンテンツは、次回配信分からとなります。現在発売中の最新号を含め、既刊の号は含まれません。ご契約はページ右の「新刊自動購入を始める」からお手続きください。
※ご契約をいただくと、このシリーズのコンテンツを配信する都度、毎回決済となります。配信されるコンテンツによって発売日・金額が異なる場合があります。ご契約中は自動的に販売を継続します。
不定期に刊行される「増刊号」「特別号」等も、自動購入の対象に含まれますのでご了承ください。(シリーズ名が異なるものは対象となりません)
※再開の見込みの立たない休刊、廃刊、出版社やReader Store側の事由で契約を終了させていただくことがあります。
※My Sony IDを削除すると新刊自動購入は解約となります。
お支払方法:クレジットカードのみ
解約方法:マイページの「予約・新刊自動購入設定」より、随時解約可能です続巻自動購入は、今後配信となるシリーズの最新刊を毎号自動的にお届けするサービスです。
- ・発売と同時にすぐにお手元のデバイスに追加!
- ・買い逃すことがありません!
- ・いつでも解約ができるから安心!
- ・優待ポイントが2倍になるおトクなキャンペーン実施中!
※続巻自動購入の対象となるコンテンツは、次回配信分からとなります。現在発売中の最新巻を含め、既刊の巻は含まれません。ご契約はページ右の「続巻自動購入を始める」からお手続きください。
※ご契約をいただくと、このシリーズのコンテンツを配信する都度、毎回決済となります。配信されるコンテンツによって発売日・金額が異なる場合があります。ご契約中は自動的に販売を継続します。
不定期に刊行される特別号等も自動購入の対象に含まれる場合がありますのでご了承ください。(シリーズ名が異なるものは対象となりません)
※再開の見込みの立たない休刊、廃刊、出版社やReader Store側の事由で契約を終了させていただくことがあります。
※My Sony IDを削除すると続巻自動購入は解約となります。
お支払方法:クレジットカードのみ
解約方法:マイページの「予約自動購入設定」より、随時解約可能ですReader Store BOOK GIFT とは
ご家族、ご友人などに電子書籍をギフトとしてプレゼントすることができる機能です。
贈りたい本を「プレゼントする」のボタンからご購入頂き、お受け取り用のリンクをメールなどでお知らせするだけでOK!
ぜひお誕生日のお祝いや、おすすめしたい本をプレゼントしてみてください。※ギフトのお受け取り期限はご購入後6ヶ月となります。お受け取りされないまま期限を過ぎた場合、お受け取りや払い戻しはできませんのでご注意ください。
※お受け取りになる方がすでに同じ本をお持ちの場合でも払い戻しはできません。
※ギフトのお受け取りにはサインアップ(無料)が必要です。
※ご自身の本棚の本を贈ることはできません。
※ポイント、クーポンの利用はできません。クーポンコード登録
Reader Storeをご利用のお客様へ
ご利用ありがとうございます!
エラー(エラーコード: )
ご協力ありがとうございました
参考にさせていただきます。