SNAP-656 Delink RDD partitions from buckets #297

ymahajan · 2016-07-05T07:32:42Z

Changes proposed in this pull request

set default rdd partitions as number of cores in cluster
map buckets to target partitions using round robin assignment
colocated tables should have same partitions and queries should work fine.
split mode support

Patch testing

ReleaseNotes.txt changes

yes

Other PRs

Store - TIBCOSoftware/snappy-store#85
Spark - TIBCOSoftware/snappy-spark#4
SnppyData - #297

…into SNAP-656

…into SNAP-656 Conflicts: core/src/main/scala/org/apache/spark/sql/store/StoreUtils.scala

… failures

Conflicts: core/src/main/scala/io/snappydata/impl/SparkShellRDDHelper.scala core/src/main/scala/org/apache/spark/sql/execution/columnar/impl/JDBCSourceAsColumnarStore.scala core/src/main/scala/org/apache/spark/sql/execution/row/RowFormatScanRDD.scala core/src/main/scala/org/apache/spark/sql/store/StoreUtils.scala store

…titionedRDD + handled redundancy cases + fixed precheckin failures

rishitesh · 2016-08-17T04:26:58Z

core/src/main/scala/org/apache/spark/sql/execution/columnar/impl/ColumnFormatRelation.scala

+//    val region = Misc.getRegionForTable(resolvedName, true).
+//        asInstanceOf[PartitionedRegion]
+//    region.getTotalNumberOfBuckets
+    val numCores = Runtime.getRuntime.availableProcessors()


This is evaluated at driver node. We need to consider sever nodes. Driver node num processors is not useful to us. Can you please see SchedulerBackend.defaultParallelism. That takes total cores for slaves into consideration.
Catch however is spark.default.parallelism gets priority and if somebody configures bad we will suffer.

rishitesh · 2016-08-17T04:30:54Z

core/src/main/scala/org/apache/spark/sql/execution/row/RowFormatRelation.scala

    }
  }

+  def getNumPartitions : Int = {


See comments above

Conflicts: core/src/main/scala/org/apache/spark/sql/collection/Utils.scala core/src/main/scala/org/apache/spark/sql/execution/columnar/impl/JDBCSourceAsColumnarStore.scala core/src/main/scala/org/apache/spark/sql/store/StoreUtils.scala store

Conflicts: core/src/main/scala/org/apache/spark/sql/execution/columnar/impl/ColumnFormatRelation.scala

…fle exchange operation Use spark.default.parallelism to decide numPartitions and disabled split mode optimization

Conflicts: core/src/main/scala/org/apache/spark/sql/execution/ExistingPlans.scala store

…into SNAP-656 Conflicts: core/src/main/scala/org/apache/spark/sql/store/StoreUtils.scala store

Conflicts: store

…rStorePartitionedRDD in split mode.

Conflicts: spark store

ymahajan added 8 commits July 5, 2016 12:51

Combining multiple buckets in sys.SET_BUCKETS_FOR_LOCAL_EXECUTION

ee33123

Merge branch 'master' of https://github.com/SnappyDataInc/snappydata …

9949a3e

…into SNAP-656

Mapping of buckets to RDD partitions for unified cluster mode.

7eafc96

Merge branch 'master' of https://github.com/SnappyDataInc/snappydata …

84d720a

…into SNAP-656 Conflicts: core/src/main/scala/org/apache/spark/sql/store/StoreUtils.scala

Using MultiBucketExecutorPartition in unified mode, fixing precheckin…

3a9f3a6

… failures

minor change

f303d7d

Northwind trader's changes

d732dfe

ymahajan assigned suranjan and rishitesh Aug 11, 2016

ymahajan added 2 commits August 11, 2016 14:02

replace hardcoded path

d186347

+ multi-bucket query execution for SparkShellRowRDD, ColumnarStorePar…

d994a10

…titionedRDD + handled redundancy cases + fixed precheckin failures

rishitesh reviewed Aug 17, 2016
View reviewed changes

Moved queries in separate object, made it configurable

ca48486

rishitesh reviewed Aug 17, 2016
View reviewed changes

ymahajan added 5 commits August 17, 2016 17:31

precheckin failuers and dunit tests for northwind schema

231f48a

Merge branch 'master' into SNAP-656

aa49696

Conflicts: core/src/main/scala/org/apache/spark/sql/collection/Utils.scala core/src/main/scala/org/apache/spark/sql/execution/columnar/impl/JDBCSourceAsColumnarStore.scala core/src/main/scala/org/apache/spark/sql/store/StoreUtils.scala store

Merge branch 'master' into SNAP-656

48939bf

Conflicts: core/src/main/scala/org/apache/spark/sql/execution/columnar/impl/ColumnFormatRelation.scala

Use numBuckets in ShuffleExchange and HashPartitioning to decide shuf…

77e9787

…fle exchange operation Use spark.default.parallelism to decide numPartitions and disabled split mode optimization

moved these classes in cluster

2c4457d

This was referenced Aug 29, 2016

SNAP-656 Delink RDD partitions from buckets TIBCOSoftware/snappy-store#85

Merged

SNAP-656 Delink RDD partitions from buckets TIBCOSoftware/snappy-spark#4

Merged

ymahajan added 3 commits August 29, 2016 23:34

Merge branch 'master' into SNAP-656

26d1c00

Conflicts: core/src/main/scala/org/apache/spark/sql/execution/ExistingPlans.scala store

Merge branch 'master' of https://github.com/SnappyDataInc/snappydata …

a4272a4

…into SNAP-656 Conflicts: core/src/main/scala/org/apache/spark/sql/store/StoreUtils.scala store

a minor change in import

fb57a30

ymahajan added 6 commits August 30, 2016 14:00

Merge branch 'master' into SNAP-656

533cab4

Conflicts: store

a minor change

7852b86

Keep numPartitions same as numBuckets in RowFormatScanRDD and Columna…

efa3a5f

…rStorePartitionedRDD in split mode.

fixing precheckin failures

a58ea03

precheckin failuers

8d8c6a2

Merge branch 'master' into SNAP-656

4923cbe

Conflicts: spark store

ymahajan merged commit 21440be into master Sep 1, 2016

sumwale deleted the SNAP-656 branch December 5, 2016 22:26

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

SNAP-656 Delink RDD partitions from buckets #297

SNAP-656 Delink RDD partitions from buckets #297

ymahajan commented Jul 5, 2016 •

edited

Loading

rishitesh Aug 17, 2016

rishitesh Aug 17, 2016

SNAP-656 Delink RDD partitions from buckets #297

SNAP-656 Delink RDD partitions from buckets #297

Conversation

ymahajan commented Jul 5, 2016 • edited Loading

Changes proposed in this pull request

Patch testing

ReleaseNotes.txt changes

Other PRs

rishitesh Aug 17, 2016

Choose a reason for hiding this comment

rishitesh Aug 17, 2016

Choose a reason for hiding this comment

ymahajan commented Jul 5, 2016 •

edited

Loading