BLOG"Spark" タグの記事です。

2020/06/15 PySparkの分散される処理単位であるクロージャと共有変数の仕組み Spark では、処理が分散されて、複数のノードやスレッドで実行されますが、分散される処理の塊を、どう配信しているのか？加えて、複数のタスク間でのデータの共有とか、集約するための仕組みがどうなっているのか？少しだけ説明します。