オライリー・ジャパン<br> 機械学習のための特徴量エンジニアリング―その原理とPythonによる実践

個数:

オライリー・ジャパン
機械学習のための特徴量エンジニアリング―その原理とPythonによる実践

  • ウェブストアに1冊在庫がございます。(2024年05月26日 14時13分現在)
    通常、ご注文翌日~2日後に出荷されます。
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【ご注意事項】 ※必ずお読みください
    ◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
    ◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
    ◆事情により出荷が遅れる場合がございます。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ B5判/ページ数 224p/高さ 24cm
  • 商品コード 9784873118680
  • NDC分類 007.1
  • Cコード C3055

出版社内容情報

機械学習や人工知能の性能を決める特徴量作成・変換/選択について詳述した書籍!
本書は、機械学習を行うエンジニアが知るべき特徴量抽出の基本から応用、最新のテーマまでを網羅した書籍です。内容としてはそれほど難しくないため、機械学習を学んでいる人が特徴量エンジニアリングについて学びはじめる書籍として最適です。

内容説明

本書は、機械学習モデルの性能を向上させるために、データから良い特徴量を作る特徴量エンジニアリングについて解説します。前半では初学者に向けて、数値、テキスト、カテゴリ変数の基本的な取り扱い方を説明し、後半では特徴量ハッシング、ビンカウンティング、PCAによるデータの圧縮、さらに非線形特徴量とモデルスタッキング、画像特徴量抽出と深層学習による自動特徴学習などの高度なテーマを扱います。特徴量エンジニアリングの原理について直感的な理解が得られるように図や例を豊富に使い、またPythonコードによる実行例を数多くあげて解説しており、実際の業務に適用するための具体的な知識が得られます。特徴量エンジニアリングを使いこなし、機械学習モデルの性能を最大限に引き出したいエンジニア必携の一冊です。Kaggle GrandmasterのKohei Ozaki(@smly)氏による「日本語版に寄せて」を収録しています。

目次

1章 機械学習パイプライン
2章 数値データの取り扱い
3章 テキストデータの取り扱い
4章 特徴量スケーリングによる効果:Bag‐of‐WordsのTF‐IDFによる重み付け
5章 カテゴリ変数の取り扱い
6章 次元削減:膨大なデータをPCAで圧縮
7章 非線形特徴量の生成:κ‐meansを使ったスタッキング
8章 特徴量作成の自動化:画像特徴量の抽出と深層学習
9章 バック・トゥ・ザ・「フィーチャー」:学術論文レコメンドアルゴリズムの構築
付録A 線形モデリングと線形代数の基礎

著者等紹介

チャン,アリス[チャン,アリス] [Zheng,Alice]
機械学習、スパニングアルゴリズム、プラットフォーム開発の技術リーダー。現在、Amazon Advertisingにおいてサイエンス研究マネージャーをしている。それ以前は、GraphLab/Dato/Turiでのツールキット開発とユーザー教育に携わり、Microsoft Researchでは機械学習の研究者だった。UC Berkeley大学で電気工学およびコンピュータサイエンスの博士号、また数学の学士号を取得している

カサリ,アマンダ[カサリ,アマンダ] [Casari,Amanda]
次世代の技術を探求し、その影響を実証しているエンジニア。Concur Labsの上級プロダクトマネージャーおよびデータサイエンティストであり、SAP ConcurにおけるConcur Labs AI Researchチームの共同設立者でもある。過去16年間にわたり、データサイエンス、機械学習、ロボティクスなど幅広いエンジニアリング分野に携わってきた。米海軍アカデミーで制御システム工学の学士号と、Vermont大学の電気工学の修士号を取得している(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

shin_ash

2
掴み所の難しい特徴量についての本。分布に関するスケーリングと変数変換から始まって、カテゴリ変数のコード化、カウント、テキスト関連のn-gram、TF-IDF、次元圧縮、クラスタリングの応用、画像特徴量からDNNまで。最後のDNNはこれを特徴量エンジニアリングと言ってしまっていいのか?と思わなくはないが、特徴量に注目すれば中身は特徴量エンジニアリングと言えなくはない。実務においては固有技術とも密接に関わり、そもそも問題の設定とタスクの内容によるところが大きいのが、実務上の理解を難しくしているのかもしれない。2019/06/01

_

1
立ち読みで十分だったか。最近は読書する気力がないので大変よろしくない。2019/09/30

ONE_shoT_

1
データの前処理・特徴量エンジニアリングの方法について広く述べられた一冊。数値データの加工(二値化・離散化・対数変換・スケーリング・交互作用項)やカテゴリデータのエンコーディングはすぐに役立ちます。他にも、k-meansで非線形特徴量をつくる方法、PCAでの次元削減からテキストデータの加工(Bag-of-Words, TF-IDF)まで、参考になります。2019/08/01

g_h_

0
実際にデータサイエンスを行う上で重要なフローはデータの前処理、特徴量設計であり、データサイエンティストの業務の8−9割はこれに占められている。そのためモデルそのものだけでなく特徴量設計についてのわかりやすい本が一冊欲しいと考えている人にとって、本書はまさにうってつけの一冊となるであろう。特徴量設計についての必要知識を過不足なく網羅していてこの上なく有益な一冊。データを扱う仕事についている人であれば必読書と言える。2020/06/27

hide_kba

0
すごくためになる。機械学習を使う人は、必須やな2019/05/15

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/13488863
  • ご注意事項

    ご注意
    リンク先のウェブサイトは、株式会社ブックウォーカーの提供する「読書メーター」のページで、紀伊國屋書店のウェブサイトではなく、紀伊國屋書店の管理下にはないものです。
    この告知で掲載しているウェブサイトのアドレスについては、当ページ作成時点のものです。ウェブサイトのアドレスについては廃止や変更されることがあります。
    最新のアドレスについては、お客様ご自身でご確認ください。
    リンク先のウェブサイトについては、「株式会社ブックウォーカー」にご確認ください。

最近チェックした商品