elastic · yngrdyn · May 9, 2024 · May 9, 2024 · May 9, 2024 · May 9, 2024
diff --git a/x-pack/plugins/observability_solution/dataset_quality/common/api_types.ts b/x-pack/plugins/observability_solution/dataset_quality/common/api_types.ts
@@ -68,11 +68,16 @@ export const getIntegrationsResponseRt = rt.exact(
   })
 );
 
-export const degradedDocsRt = rt.type({
-  dataset: rt.string,
-  percentage: rt.number,
-  count: rt.number,
-});
+export const degradedDocsRt = rt.intersection([
+  rt.type({
+    dataset: rt.string,
+  }),
+  rt.partial({
+    count: rt.number,
+    totalDocs: rt.number,
+    percentage: rt.number,
+  }),
+]);
 
 export type DegradedDocs = rt.TypeOf<typeof degradedDocsRt>;
 

diff --git a/...ns/observability_solution/dataset_quality/server/routes/data_streams/get_degraded_docs.ts b/...ns/observability_solution/dataset_quality/server/routes/data_streams/get_degraded_docs.ts
@@ -25,10 +25,10 @@ export async function getDegradedDocsPaginated(options: {
   end?: number;
   datasetQuery?: string;
   after?: {
-    dataset: string;
-    namespace: string;
+    degradedDocs?: { dataset: string; namespace: string };
+    totalDocs?: { dataset: string; namespace: string };
   };
-  prevResults?: DegradedDocs[];
+  prevResults?: { degradedDocs: DegradedDocs[]; totalDocs: DegradedDocs[] };
 }): Promise<DegradedDocs[]> {
   const {
     esClient,
@@ -37,74 +37,121 @@ export async function getDegradedDocsPaginated(options: {
     start,
     end,
     after,
-    prevResults = [],
+    prevResults = { degradedDocs: [], totalDocs: [] },
   } = options;
 
   const datasetQualityESClient = createDatasetQualityESClient(esClient);
 
-  const response = await datasetQualityESClient.search({
-    index: '*',
-    size: 0,
-    query: {
-      bool: {
-        ...(datasetQuery
-          ? {
-              should: [
-                ...wildcardQuery(DATA_STREAM_DATASET, datasetQuery),
-                ...wildcardQuery(DATA_STREAM_NAMESPACE, datasetQuery),
-              ],
-              minimum_should_match: 1,
-            }
-          : {}),
-        filter: [...rangeQuery(start, end), ...termQuery(DATA_STREAM_TYPE, type)],
+  const datasetFilter = {
+    ...(datasetQuery
+      ? {
+          should: [
+            ...wildcardQuery(DATA_STREAM_DATASET, datasetQuery),
+            ...wildcardQuery(DATA_STREAM_NAMESPACE, datasetQuery),
+          ],
+          minimum_should_match: 1,
+        }
+      : {}),
+  };
+
+  const otherFilters = [...rangeQuery(start, end), ...termQuery(DATA_STREAM_TYPE, type)];
+
+  const aggs = (afterKey?: { dataset: string; namespace: string }) => ({
+    datasets: {
+      composite: {
+        ...(afterKey ? { after: afterKey } : {}),
+        size: 10000,
+        sources: [
+          { dataset: { terms: { field: 'data_stream.dataset' } } },
+          { namespace: { terms: { field: 'data_stream.namespace' } } },
+        ],
       },
     },
-    aggs: {
-      datasets: {
-        composite: {
-          ...(after ? { after } : {}),
-          size: 10000,
-          sources: [
-            { dataset: { terms: { field: DATA_STREAM_DATASET } } },
-            { namespace: { terms: { field: DATA_STREAM_NAMESPACE } } },
-          ],
+  });
+
+  const response = await datasetQualityESClient.msearch({ index: `${type}-*` }, [
+    // degraded docs per dataset
+    {
+      size: 0,
+      query: {
+        bool: {
+          ...datasetFilter,
+          filter: otherFilters,
+          must: { exists: { field: _IGNORED } },
         },
-        aggs: {
-          degraded: {
-            filter: {
-              exists: {
-                field: _IGNORED,
-              },
-            },
-          },
+      },
+      aggs: aggs(after?.degradedDocs),
+    },
+    // total docs per dataset
+    {
+      size: 0,
+      query: {
+        bool: {
+          ...datasetFilter,
+          filter: otherFilters,
         },
       },
+      aggs: aggs(after?.totalDocs),
     },
-  });
+  ]);
 
   const currDegradedDocs =
-    response.aggregations?.datasets.buckets.map((bucket) => ({
+    response.responses[0].aggregations?.datasets.buckets.map((bucket) => ({
+      dataset: `${type}-${bucket.key.dataset}-${bucket.key.namespace}`,
+      count: bucket.doc_count,
+    })) ?? [];
+
+  const degradedDocs = [...prevResults.degradedDocs, ...currDegradedDocs];
+
+  const currTotalDocs =
+    response.responses[1].aggregations?.datasets.buckets.map((bucket) => ({
       dataset: `${type}-${bucket.key.dataset}-${bucket.key.namespace}`,
-      percentage: (bucket.degraded.doc_count * 100) / bucket.doc_count,
-      count: bucket.degraded.doc_count,
+      totalDocs: bucket.doc_count,
     })) ?? [];
 
-  const degradedDocs = [...prevResults, ...currDegradedDocs];
+  const totalDocs = [...prevResults.totalDocs, ...currTotalDocs];
 
-  if (response.aggregations?.datasets.after_key) {
+  if (
+    response.responses[0].aggregations?.datasets.after_key ||
+    response.responses[1].aggregations?.datasets.after_key
+  ) {
     return getDegradedDocsPaginated({
       esClient,
       type,
       start,
       end,
       datasetQuery,
       after: {
-        dataset: response.aggregations?.datasets.after_key.dataset as string,
-        namespace: response.aggregations?.datasets.after_key.namespace as string,
+        degradedDocs:
+          (response.responses[0].aggregations?.datasets.after_key as {
+            dataset: string;
+            namespace: string;
+          }) || after?.degradedDocs,
+        totalDocs:
+          (response.responses[1].aggregations?.datasets.after_key as {
+            dataset: string;
+            namespace: string;
+          }) || after?.totalDocs,
       },
-      prevResults: degradedDocs,
+      prevResults: { degradedDocs, totalDocs },
     });
   }
 
-  return degradedDocs;
+  const degradedDocsMap = degradedDocs.reduce(
+    (acc, curr) => ({
+      ...acc,
+      [curr.dataset]: curr.count,
+    }),
+    {}
+  );
+
+  return totalDocs.map((curr) => {
+    const degradedDocsCount = degradedDocsMap[curr.dataset as keyof typeof degradedDocsMap] || 0;
+
+    return {
+      ...curr,
+      count: degradedDocsCount,
+      percentage: (degradedDocsCount / curr.totalDocs!) * 100,
+    };
+  });
 }
diff --git a/...s/observability_solution/dataset_quality/server/utils/create_dataset_quality_es_client.ts b/...s/observability_solution/dataset_quality/server/utils/create_dataset_quality_es_client.ts
@@ -7,6 +7,7 @@
 
 import { ESSearchRequest, InferSearchResponseOf } from '@kbn/es-types';
 import { ElasticsearchClient } from '@kbn/core/server';
+import { Indices } from '@elastic/elasticsearch/lib/api/types';
 
 type DatasetQualityESSearchParams = ESSearchRequest & {
   size: number;
@@ -21,5 +22,15 @@ export function createDatasetQualityESClient(esClient: ElasticsearchClient) {
     ): Promise<InferSearchResponseOf<TDocument, TParams>> {
       return esClient.search<TDocument>(searchParams) as Promise<any>;
     },
+    async msearch<TDocument, TParams extends DatasetQualityESSearchParams>(
+      index = {} as { index?: Indices },
+      searches: TParams[]
+    ): Promise<{
+      responses: Array<InferSearchResponseOf<TDocument, TParams>>;
+    }> {
+      return esClient.msearch({
+        searches: searches.map((search) => [index, search]).flat(),
+      }) as Promise<any>;
+    },
   };
 }