最安値はここだ! -価格比較-

※商品名はHMV&BOOKS online Yahoo!店のものです

Apache Spark徹底入門 徹底入門 / 長谷川亮 〔本〕

商品について

JANコード
9784798182285
希望小売価格
4400
Y!での商品説明(HMV&BOOKS online Yahoo!店)
発売日:2024年04月 / ジャンル:建築・理工 / フォーマット:本 / 出版社:翔泳社 / 発売国:日本 / ISBN:9784798182285 / アーティストキーワード:長谷川亮

内容詳細:Apache Sparkの仕組みとビッグデータ向けの大規模処理とML開発を徹底解説本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Spark、mlflow、delta lakeの中級入門書です。「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データAIの実装者がApache Spark、MLflow およびdelta lakeを使いこなすための解説を行います。本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。Apache Sparkの導入か・・・
楽天での商品説明(楽天ブックス)
Jules S. Damji Brooke Wenig 翔泳社アパッチスパークテッテイニュウモン ジュールス エス タムジ ブルック ウェニグ 発行年月:2024年04月12日 予約締切日:2024年02月14日 ページ数:464p サイズ:単行本 ISBN:9784798182285 Damji,Jules S. Databricks社のSenior Developer Advocateであり、MLflowのコントリビュータ。Sun Microsystems、Netscape、@Home、Loudcloud/Opsware、Verisign、ProQuest、Hortonworksなどの大手企業でソフトウェアエンジニアとして勤務し、大規模分散システムを構築。オレゴン州立大学、カリフォルニア州立大学、ジョンズ・ホプキンス大学でそれぞれコンピュータサイエンスの学士号と修士号、 Political Advocacyとコミュニケーションの修士号を取得 Wenig,Brooke 顧客のために大規模な機械学習パイプラインを開発するデータサイエンティストのチームを率いるほか、分散機械学習のベストプラクティスに関するコースを指導。以前は、Databricksのプリンシパル・データサイエンス・コンサルタント。UCLAで分散機械学習を中心にコンピュータサイエンスの修士号を取得 Das,Tathagata Databricks社のスタッフソフトウェアエンジニアであり、Apache Sparkのコミッター、Apache Spark Project Management Committee(PMC)のメンバー。Apache Sparkのオリジナル開発者の一人で、Spark Streaming(DStreams)のリード開発者であり、現在はStructured StreamingとDelta Lakeのコア開発者の一人。カリフォルニア大学バークレー校でコンピューターサイエンスの修士号を取得 Lee,Denny DatabricksのStaff Developer Advocateで、Apache Sparkを0.6から使用しています。インターネットスケールのインフラ、データプラットフォーム、オンプレミスおよびクラウド環境の予測分析システムの開発で豊富な経験を持つ、実践的な分散システムおよびデータサイエンスのエンジニアです。また、オレゴン健康科学大学で生物医学情報学の修士号を取得し、企業ヘルスケア顧客向けに強力なデータソリューションを設計・実装した経験を持つ(本データはこの書籍が刊行された当時に掲載されていたものです) 1 Apache Spark入門/2 Apache Sparkのダウンロードと入門/3 Apache Sparkの構造化API/4 Spark SQLとDataFrame:組み込みデータソースの紹介/5 Spark SQLとDataFrame:外部データソースとのインタラクション/6 Spark SQLとDataset:7 Sparkアプリケーションの最適化およびチューニング/8 構造化Streaming/9 Apache Sparkを用いた信頼性の高いデータレイクの構築/10 MLlibによる機械学習/11 Apache Sparkによる機械学習パイプラインの管理、デプロイおよびスケール/12 エピローグ:Apache Spark 3.x 統合型アナリティクスエンジンの仕組みとビッグデータの大規模処理を徹底解説。基本操作からDelta LakeやMLlibを利用したパイプラインの構築まで紹介。 本 パソコン・システム開発 その他