My Talks
PySparkだけで頑張らないApache Sparkによる分散処理基盤構築
大量データの分散処理フレームワークとして人気のApache Spark、
Scala製でありがながらも、PySparkのおかげでPythonエンジニアでも
その強大なパワーにリーチ可能です。
しかし、例えばJavaの資産を使う場合等、どうしてもScala (or Java)の
力に頼らざるを得ない等、上司と揉めながらもPythonistaとして苦渋の決断を下す局面もきっとあるかと思います。私...