4pt

Apache Spark入門 動かして学ぶ最新並列分散処理フレームワーク (NEXT ONE)

株式会社NTTデータ, 猿田浩輔, 土橋 昌, 吉田耕陽, 佐々木 徹, 都築正宜 | 翔泳社 | 2015-10-29

ビッグデータ、機械学習、IoTなどの分野で、応用が期待される話題のオープンソースソフトを書下ろしで解説 Apache Sparkは多数のコンピュータを並列で動かして高速処理を実現する技術です。大量データのバッチ処理や機械学習など、ビッグデータの分野での活用が期待されるOSS(…

4pt

4pt

Hadoop 第3版

Tom White | オライリージャパン | 2013-07-26

『Hadoop』の第3版の登場です。今回の改訂では、Hadoop0.22系、2.x系の記述を大幅加筆。次世代Hadoopの特徴であるYARN(Hadoop 2.x系におけるジョブ実行フレームワーク)やMapReduce2について詳述しました。Hadoop1.x(旧0.20)の情…

4pt

4pt

Hadoop徹底入門 第2版 オープンソース分散処理環境の構築

太田 一樹, 岩崎 正剛, 猿田 浩輔, 下垣 徹, 藤井 達朗, 山下 真一 | 翔泳社 | 2013-07-09

Hadoopは、多数のコンピュータを束ねて極めて大きな処理ができるオープンソースソフトウェアです。MapReduceというJavaフレームワークでプログラミングできるほか、標準入出力が使えるHadoopStreaming、フロー記述環境Pig、SQL風インターフェイスであるHi…

4pt

4pt

Kafka

Neha Narkhede, Gwen Shapira, Todd Palino | オライリージャパン | 2018-08-03

Kafkaの構造や特徴を学習し、Kafkaを取り入れた設計など、実動環境で使えるようになるための一連の流れを学ぶ。 リアルタイムのストリーム処理プラットフォーム「Kafka」の考え方と使い方を詳述 ! 本書は、KafkaのProducerとConsumerがメッセージを読み書…

4pt

4pt

Apache Kafka 分散メッセージングシステムの構築と活用 (NEXT ONE)

株式会社NTTデータ, 佐々木 徹, 岩崎 正剛, 猿田 浩輔, 都築 正宜, 吉田 耕陽 | 翔泳社 | 2018-10-30

ビックデータ分析のための新しい仕組みであるKafkaの基礎からシステムにおけるさまざまな活用パタン/事例を紹介 IoTや機械学習などのデータ処理を支える新基盤 Apache Kafkaは分散処理の基盤として開発されたオープンソースのプラットフォームです。従来からあるメッセー…

4pt

3pt

Sparkによる実践データ解析 ―大規模データのための機械学習事例集

Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills | オライリージャパン | 2016-01-23

ビッグデータを活用するためのデータサイエンスについてSparkを通して学ぶことができる書籍。 Sparkの基本を学んだ人が、さらにSparkでデータ分析をする方法を学ぶ本! 実際の利用シーンを踏まえており、ビッグデータを活用するためのデータサイエンスについてSparkを通して…

3pt

0pt

初めてのSpark

Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia | オライリージャパン | 2015-08-22

ビッグデータ処理のプラットフォームとして注目されるApache Sparkの総合解説書。開発者に広くアピールする内容。 次世代のビッグデータ処理のプラットフォームとして注目されるApache Sparkの総合解説書! 本書はSparkを初めて使う人から、クラスタ上で本格的な利…

0pt

0pt

岩波データサイエンス Vol.2

 | 岩波書店 | 2016-02-17

特集 統計的自然言語処理-ことばを扱う機械(ことばのモデル入門 言葉の個性をとらえるトピックモデル 創発する記号-ことばを知るロボット Pythonでword2vec 単語の意味をコンピュータに教える 自然言語の意味に対する2つのアプローチ-記号表現と分散表現 人間の翻訳、機械…

0pt