googleapis · harshachinta · Feb 8, 2024 · Jan 12, 2024 · Jan 12, 2024 · Jan 12, 2024
diff --git a/go.work b/go.work
@@ -163,4 +163,5 @@ use (
 	./websecurityscanner
 	./workflows
 	./workstations
+	./spanner/test/opentelemetry/test
 )
diff --git a/go.work.sum b/go.work.sum
@@ -149,6 +149,9 @@ func (t *BatchReadOnlyTransaction) PartitionReadUsingIndexWithOptions(ctx contex
 			trace.TracePrintf(ctx, nil, "Error in recording GFE Latency. Try disabling and rerunning. Error: %v", err)
 		}
 	}
+	if metricErr := recordGFELatencyMetricsOT(ctx, md, "PartitionReadUsingIndexWithOptions", t.otConfig); metricErr != nil {
+		trace.TracePrintf(ctx, nil, "Error in recording GFE Latency through OpenTelemetry. Error: %v", metricErr)
+	}
 	// Prepare ReadRequest.
 	req := &sppb.ReadRequest{
 		Session:             sid,
@@ -213,6 +216,9 @@ func (t *BatchReadOnlyTransaction) partitionQuery(ctx context.Context, statement
 			trace.TracePrintf(ctx, nil, "Error in recording GFE Latency. Try disabling and rerunning. Error: %v", err)
 		}
 	}
+	if metricErr := recordGFELatencyMetricsOT(ctx, md, "partitionQuery", t.otConfig); metricErr != nil {
+		trace.TracePrintf(ctx, nil, "Error in recording GFE Latency through OpenTelemetry. Error: %v", metricErr)
+	}
 
 	// prepare ExecuteSqlRequest
 	r := &sppb.ExecuteSqlRequest{
@@ -284,6 +290,9 @@ func (t *BatchReadOnlyTransaction) Cleanup(ctx context.Context) {
 			trace.TracePrintf(ctx, nil, "Error in recording GFE Latency. Try disabling and rerunning. Error: %v", err)
 		}
 	}
+	if metricErr := recordGFELatencyMetricsOT(ctx, md, "Cleanup", t.otConfig); metricErr != nil {
+		trace.TracePrintf(ctx, nil, "Error in recording GFE Latency through OpenTelemetry. Error: %v", metricErr)
+	}
 
 	if err != nil {
 		var logger *log.Logger
@@ -336,6 +345,9 @@ func (t *BatchReadOnlyTransaction) Execute(ctx context.Context, p *Partition) *R
 					trace.TracePrintf(ctx, nil, "Error in recording GFE Latency. Try disabling and rerunning. Error: %v", err)
 				}
 			}
+			if metricErr := recordGFELatencyMetricsOT(ctx, md, "Execute", t.otConfig); metricErr != nil {
+				trace.TracePrintf(ctx, nil, "Error in recording GFE Latency through OpenTelemetry. Error: %v", metricErr)
+			}
 			return client, err
 		}
 	} else {
@@ -363,6 +375,9 @@ func (t *BatchReadOnlyTransaction) Execute(ctx context.Context, p *Partition) *R
 					trace.TracePrintf(ctx, nil, "Error in recording GFE Latency. Try disabling and rerunning. Error: %v", err)
 				}
 			}
+			if metricErr := recordGFELatencyMetricsOT(ctx, md, "Execute", t.otConfig); metricErr != nil {
+				trace.TracePrintf(ctx, nil, "Error in recording GFE Latency through OpenTelemetry. Error: %v", metricErr)
+			}
 			return client, err
 		}
 	}

diff --git a/spanner/benchmarks_oc_ot_test.go b/spanner/benchmarks_oc_ot_test.go
@@ -0,0 +1,250 @@
+/*
+Copyright 2020 Google LLC
+
+Licensed under the Apache License, Version 2.0 (the "License");
+you may not use this file except in compliance with the License.
+You may obtain a copy of the License at
+
+    http://www.apache.org/licenses/LICENSE-2.0
+
+Unless required by applicable law or agreed to in writing, software
+distributed under the License is distributed on an "AS IS" BASIS,
+WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+See the License for the specific language governing permissions and
+limitations under the License.
+*/
+
+package spanner
+
+import (
+	"context"
+	"fmt"
+	"log"
+	"math/rand"
+	"sort"
+	"sync"
+	"testing"
+	"time"
+
+	"go.opencensus.io/trace"
+	"google.golang.org/api/option"
+
+	"contrib.go.opencensus.io/exporter/stackdriver"
+	"go.opentelemetry.io/otel/sdk/metric"
+	"google.golang.org/api/iterator"
+)
+
+var muElapsedTimes sync.Mutex
+var elapsedTimes []time.Duration
+var (
+	selectQuery           = "SELECT ID FROM BENCHMARK WHERE ID = @id"
+	updateQuery           = "UPDATE BENCHMARK SET BAR=1 WHERE ID = @id"
+	idColumnName          = "id"
+	randomSearchSpace     = 99999
+	totalReadsPerThread   = 30000
+	totalUpdatesPerThread = 10000
+	parallelThreads       = 5
+)
+
+func createBenchmarkActualServer(ctx context.Context, incStep uint64, clientConfig ClientConfig, database string, mp *metric.MeterProvider) (client *Client, err error) {
+	t := &testing.T{}
+	clientConfig.SessionPoolConfig = SessionPoolConfig{
+		MinOpened: 100,
+		MaxOpened: 400,
+		incStep:   incStep,
+	}
+	if mp != nil {
+		clientConfig.OpenTelemetryMeterProvider = mp
+	}
+	options := []option.ClientOption{option.WithEndpoint("staging-wrenchworks.sandbox.googleapis.com:443")}
+	client, err = NewClientWithConfig(ctx, database, clientConfig, options...)
+	if err != nil {
+		log.Printf("Newclient error : %q", err)
+	}
+	log.Printf("New client initialized")
+	// Wait until the session pool has been initialized.
+	waitFor(t, func() error {
+		if uint64(client.idleSessions.idleList.Len()) == client.idleSessions.MinOpened {
+			return nil
+		}
+		return fmt.Errorf("not yet initialized")
+	})
+	return
+}
+
+func readWorkerReal(client *Client, b *testing.B, jobs <-chan int, results chan<- int) {
+	for range jobs {
+		startTime := time.Now()
+		iter := client.Single().Query(context.Background(), getRandomisedReadStatement())
+		row := 0
+		for {
+			_, err := iter.Next()
+			if err == iterator.Done {
+				break
+			}
+			if err != nil {
+				b.Fatal(err)
+			}
+			row++
+		}
+		iter.Stop()
+
+		// Calculate the elapsed time
+		elapsedTime := time.Since(startTime)
+		storeElapsedTime(elapsedTime)
+
+		// return row as 1, so that we know total number of queries executed.
+		results <- row
+	}
+}
+
+func writeWorkerReal(client *Client, b *testing.B, jobs <-chan int, results chan<- int64) {
+	for range jobs {
+		startTime := time.Now()
+		var updateCount int64
+		var err error
+		if _, err = client.ReadWriteTransaction(context.Background(), func(ctx context.Context, transaction *ReadWriteTransaction) error {
+			if updateCount, err = transaction.Update(ctx, getRandomisedUpdateStatement()); err != nil {
+				return err
+			}
+			return nil
+		}); err != nil {
+			b.Fatal(err)
+		}
+
+		// Calculate the elapsed time
+		elapsedTime := time.Since(startTime)
+		storeElapsedTime(elapsedTime)
+
+		results <- updateCount
+	}
+}
+
+func BenchmarkClientBurstReadWriteIncStep25RealServerOpenCensus(b *testing.B) {
+	b.Logf("Running Burst Write Benchmark With OpenCensus instrumentation")
+	if err := EnableStatViews(); err != nil {
+		log.Fatalf("Failed: %v", err)
+	}
+	if err := EnableGfeLatencyView(); err != nil {
+		log.Fatalf("Failed: %v", err)
+	}
+	elapsedTimes = []time.Duration{}
+	// Create OpenCensus Stackdriver exporter.
+	sd, err := stackdriver.NewExporter(stackdriver.Options{
+		ProjectID:         "span-cloud-testing",
+		ReportingInterval: 10 * time.Second,
+		//TraceSpansBufferMaxBytes: 100,
+		BundleDelayThreshold: 50 * time.Millisecond,
+		BundleCountThreshold: 5000,
+	})
+	sd.StartMetricsExporter()
+	// Register it as a trace exporter
+	trace.RegisterExporter(sd)
+	trace.ApplyConfig(trace.Config{DefaultSampler: trace.AlwaysSample()})
+	if err != nil {
+		log.Fatalf("Failed: %v", err)
+	}
+
+	meterProvider := setupAndEnableOT()
+	burstReadAndWrite(b, 25, "projects/span-cloud-testing/instances/harsha-test-gcloud/databases/database1", meterProvider)
+	sd.Flush()
+	sd.StopMetricsExporter()
+}
+
+func burstReadAndWrite(b *testing.B, incStep uint64, database string, mp *metric.MeterProvider) {
+	for n := 0; n < b.N; n++ {
+		log.Printf("burstReadAndWrite called once")
+		client, err := createBenchmarkActualServer(context.Background(), incStep, ClientConfig{}, database, mp)
+		if err != nil {
+			b.Fatalf("Failed to initialize the client: error : %q", err)
+		}
+		sp := client.idleSessions
+		if uint64(sp.idleList.Len()) != sp.MinOpened {
+			b.Fatalf("session count mismatch\nGot: %d\nWant: %d", sp.idleList.Len(), sp.MinOpened)
+		}
+
+		totalUpdates := parallelThreads * totalUpdatesPerThread
+		writeJobs := make(chan int, totalUpdates)
+		writeResults := make(chan int64, totalUpdates)
+		parallelWrites := parallelThreads
+
+		totalQueries := parallelThreads * totalReadsPerThread
+		readJobs := make(chan int, totalQueries)
+		readResults := make(chan int, totalQueries)
+		parallelReads := parallelThreads
+
+		for w := 0; w < parallelWrites; w++ {
+			go writeWorkerReal(client, b, writeJobs, writeResults)
+		}
+		for j := 0; j < totalUpdates; j++ {
+			writeJobs <- j
+		}
+		for w := 0; w < parallelReads; w++ {
+			go readWorkerReal(client, b, readJobs, readResults)
+		}
+		for j := 0; j < totalQueries; j++ {
+			readJobs <- j
+		}
+
+		close(writeJobs)
+		close(readJobs)
+
+		totalUpdatedRows := int64(0)
+		for a := 0; a < totalUpdates; a++ {
+			totalUpdatedRows = totalUpdatedRows + <-writeResults
+		}
+		b.Logf("Total Updates: %d", totalUpdatedRows)
+		totalReadRows := 0
+		for a := 0; a < totalQueries; a++ {
+			totalReadRows = totalReadRows + <-readResults
+		}
+		b.Logf("Total Reads: %d", totalReadRows)
+		reportBenchmarkResults(b, sp)
+		client.Close()
+	}
+}
+
+func reportBenchmarkResults(b *testing.B, sp *sessionPool) {
+	sp.mu.Lock()
+	defer sp.mu.Unlock()
+	b.Logf("NumSessions: %d\t", sp.idleList.Len())
+
+	muElapsedTimes.Lock()
+	defer muElapsedTimes.Unlock()
+	sort.Slice(elapsedTimes, func(i, j int) bool {
+		return elapsedTimes[i] < elapsedTimes[j]
+	})
+
+	b.Logf("Total number of queries: %d\n", len(elapsedTimes))
+	//	b.Logf("%q", elapsedTimes)
+	b.Logf("P50: %q\n", percentile(50, elapsedTimes))
+	b.Logf("P95: %q\n", percentile(95, elapsedTimes))
+	b.Logf("P99: %q\n", percentile(99, elapsedTimes))
+	elapsedTimes = nil
+}
+
+func percentile(percentile int, orderedResults []time.Duration) time.Duration {
+	index := percentile * len(orderedResults) / 100
+	value := orderedResults[index]
+	return value
+}
+
+func storeElapsedTime(elapsedTime time.Duration) {
+	muElapsedTimes.Lock()
+	defer muElapsedTimes.Unlock()
+	elapsedTimes = append(elapsedTimes, elapsedTime)
+}
+
+func getRandomisedReadStatement() Statement {
+	randomKey := rand.Intn(randomSearchSpace)
+	stmt := NewStatement(selectQuery)
+	stmt.Params["id"] = randomKey
+	return stmt
+}
+
+func getRandomisedUpdateStatement() Statement {
+	randomKey := rand.Intn(randomSearchSpace)
+	stmt := NewStatement(updateQuery)
+	stmt.Params["id"] = randomKey
+	return stmt
+}