From 7f8870f59ab163d7b06a3a0f8ced816e25526c69 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Tue, 27 Sep 2022 14:02:17 -0700
Subject: [PATCH 01/34] refactor(worker): Only retrieve files in per tree
 object chunks

This breaking API change for the worker moves to per git tree file requests instead of prefix slicing the entire file tree. This allows for more efficient top level requests and recursion by fetching smaller slices of the dataset as needed.
---
 services/datalad/datalad_service/app.py       |  3 +
 .../datalad/datalad_service/common/annex.py   | 19 +++--
 .../datalad/datalad_service/handlers/draft.py |  6 +-
 .../datalad/datalad_service/handlers/files.py | 79 ++++++++-----------
 .../datalad_service/handlers/snapshots.py     |  5 +-
 .../datalad/datalad_service/handlers/tree.py  | 21 +++++
 .../datalad/datalad_service/tasks/files.py    |  4 +-
 .../datalad_service/tasks/snapshots.py        |  3 +-
 services/datalad/tests/test_files.py          | 50 ++++++++----
 9 files changed, 114 insertions(+), 76 deletions(-)
 create mode 100644 services/datalad/datalad_service/handlers/tree.py

diff --git a/services/datalad/datalad_service/app.py b/services/datalad/datalad_service/app.py
index 46343c8397..f3769705a3 100644
--- a/services/datalad/datalad_service/app.py
+++ b/services/datalad/datalad_service/app.py
@@ -17,6 +17,7 @@
 from datalad_service.handlers.snapshots import SnapshotResource
 from datalad_service.handlers.heartbeat import HeartbeatResource
 from datalad_service.handlers.publish import PublishResource
+from datalad_service.handlers.tree import TreeResource
 from datalad_service.handlers.upload import UploadResource
 from datalad_service.handlers.upload_file import UploadFileResource
 from datalad_service.handlers.validation import ValidationResource
@@ -66,6 +67,7 @@ def create_app(annex_path):
     dataset_files = FilesResource(store)
     dataset_annex_objects = AnnexObjectsResource(store)
     dataset_publish = PublishResource(store)
+    dataset_tree = TreeResource(store)
     dataset_snapshots = SnapshotResource(store)
     dataset_upload = UploadResource(store)
     dataset_upload_file = UploadFileResource(store)
@@ -90,6 +92,7 @@ def create_app(annex_path):
 
     api.add_route('/datasets/{dataset}/files', dataset_files)
     api.add_route('/datasets/{dataset}/files/{filename:path}', dataset_files)
+    api.add_route('/datasets/{dataset}/tree/{tree}', dataset_tree)
 
     api.add_route('/datasets/{dataset}/snapshots', dataset_snapshots)
     api.add_route(
diff --git a/services/datalad/datalad_service/common/annex.py b/services/datalad/datalad_service/common/annex.py
index 8bd377a6e1..1a8fc84b2e 100644
--- a/services/datalad/datalad_service/common/annex.py
+++ b/services/datalad/datalad_service/common/annex.py
@@ -50,9 +50,9 @@ def read_ls_tree_line(gitTreeLine, files, symlinkFilenames, symlinkObjects):
     filename, mode, obj_type, obj_hash, size = parse_ls_tree_line(
         gitTreeLine)
     # Skip git / datalad files
-    if filename.startswith('.git/'):
+    if filename.startswith('.git'):
         return
-    if filename.startswith('.datalad/'):
+    if filename.startswith('.datalad'):
         return
     if filename == '.gitattributes':
         return
@@ -66,9 +66,14 @@ def read_ls_tree_line(gitTreeLine, files, symlinkFilenames, symlinkObjects):
         return
     else:
         # Immediately append regular files
-        file_id = compute_file_hash(obj_hash, filename)
-        files.append({'filename': filename, 'size': int(size),
-                      'id': file_id, 'key': obj_hash, 'urls': [], 'annexed': False})
+        if (size == '-'):
+            # Tree objects do not have sizes and are never annexed
+            files.append(
+                {'id': obj_hash, 'filename': filename, 'directory': True, 'annexed': False, 'size': 0, 'urls': []})
+        else:
+            file_id = compute_file_hash(obj_hash, filename)
+            files.append({'filename': filename, 'size': int(size),
+                          'id': file_id, 'key': obj_hash, 'urls': [], 'annexed': False})
 
 
 def compute_rmet(key):
@@ -176,10 +181,10 @@ def get_repo_urls(path, files):
     return files
 
 
-def get_repo_files(dataset_path, branch='HEAD'):
+def get_repo_files(dataset_path, tree):
     """Read all files in a repo at a given branch, tag, or commit hash."""
     gitProcess = subprocess.Popen(
-        ['git', 'ls-tree', '-l', '-r', branch], cwd=dataset_path, stdout=subprocess.PIPE, encoding='utf-8')
+        ['git', 'ls-tree', '-l', tree], cwd=dataset_path, stdout=subprocess.PIPE, encoding='utf-8')
     files = []
     symlinkFilenames = []
     symlinkObjects = []
diff --git a/services/datalad/datalad_service/handlers/draft.py b/services/datalad/datalad_service/handlers/draft.py
index 8cfe59b5a3..07d2efe8fe 100644
--- a/services/datalad/datalad_service/handlers/draft.py
+++ b/services/datalad/datalad_service/handlers/draft.py
@@ -1,5 +1,3 @@
-import sys
-
 import falcon
 import pygit2
 
@@ -19,7 +17,9 @@ def on_get(self, req, resp, dataset):
             # Maybe turn this into status?
             dataset_path = self.store.get_dataset_path(dataset)
             repo = pygit2.Repository(dataset_path)
-            resp.media = {'hexsha': repo.head.target.hex}
+            commit = repo.revparse_single('HEAD')
+            resp.media = {'hexsha': commit.hex,
+                          'tree': commit.tree_id.hex}
             resp.status = falcon.HTTP_OK
         else:
             resp.status = falcon.HTTP_NOT_FOUND
diff --git a/services/datalad/datalad_service/handlers/files.py b/services/datalad/datalad_service/handlers/files.py
index 604c340ac1..491f4ce1ca 100644
--- a/services/datalad/datalad_service/handlers/files.py
+++ b/services/datalad/datalad_service/handlers/files.py
@@ -6,7 +6,6 @@
 from datalad_service.common.git import git_show
 from datalad_service.common.user import get_user_info
 from datalad_service.common.stream import update_file
-from datalad_service.tasks.files import get_files
 from datalad_service.tasks.files import remove_files
 
 
@@ -16,52 +15,42 @@ def __init__(self, store):
         self.store = store
         self.logger = logging.getLogger('datalad_service.' + __name__)
 
-    def on_get(self, req, resp, dataset, filename=None, snapshot='HEAD'):
+    def on_get(self, req, resp, dataset, filename, snapshot='HEAD'):
         ds_path = self.store.get_dataset_path(dataset)
-        if filename:
-            try:
-                file_content = git_show(ds_path, snapshot, filename)
-                # If the file begins with an annex path, return that path
-                if file_content[0:4096].find('.git/annex') != -1:
-                    # Resolve absolute path for annex target
-                    target_path = os.path.join(
-                        ds_path, os.path.dirname(filename), file_content)
-                    # Verify the annex path is within the dataset dir
-                    if ds_path == os.path.commonpath((ds_path, target_path)):
-                        fd = open(target_path, 'rb')
-                        resp.stream = fd
-                        resp.stream_len = os.fstat(fd.fileno()).st_size
-                        resp.status = falcon.HTTP_OK
-                    else:
-                        resp.media = {'error': 'file not found in git tree'}
-                        resp.status = falcon.HTTP_NOT_FOUND
-                else:
-                    resp.body = file_content
+        try:
+            file_content = git_show(ds_path, snapshot, filename)
+            # If the file begins with an annex path, return that path
+            if file_content[0:4096].find('.git/annex') != -1:
+                # Resolve absolute path for annex target
+                target_path = os.path.join(
+                    ds_path, os.path.dirname(filename), file_content)
+                # Verify the annex path is within the dataset dir
+                if ds_path == os.path.commonpath((ds_path, target_path)):
+                    fd = open(target_path, 'rb')
+                    resp.stream = fd
+                    resp.stream_len = os.fstat(fd.fileno()).st_size
                     resp.status = falcon.HTTP_OK
-            except KeyError:
-                # File is not present in tree
-                resp.media = {'error': 'file not found in git tree'}
-                resp.status = falcon.HTTP_NOT_FOUND
-            except IOError:
-                # File is not kept locally
-                resp.media = {'error': 'file not found'}
-                resp.status = falcon.HTTP_NOT_FOUND
-            except:
-                # Some unknown error
-                resp.media = {
-                    'error': 'an unknown error occurred accessing this file'}
-                resp.status = falcon.HTTP_INTERNAL_SERVER_ERROR
-                self.logger.exception(
-                    'An unknown error processing file "{}"'.format(filename))
-        else:
-            # Request for index of files
-            # Return a list of file objects
-            # {name, path, size}
-            try:
-                files = get_files(self.store, dataset, snapshot)
-                resp.media = {'files': files}
-            except:
-                resp.status = falcon.HTTP_INTERNAL_SERVER_ERROR
+                else:
+                    resp.media = {'error': 'file not found in git tree'}
+                    resp.status = falcon.HTTP_NOT_FOUND
+            else:
+                resp.body = file_content
+                resp.status = falcon.HTTP_OK
+        except KeyError:
+            # File is not present in tree
+            resp.media = {'error': 'file not found in git tree'}
+            resp.status = falcon.HTTP_NOT_FOUND
+        except IOError:
+            # File is not kept locally
+            resp.media = {'error': 'file not found'}
+            resp.status = falcon.HTTP_NOT_FOUND
+        except:
+            # Some unknown error
+            resp.media = {
+                'error': 'an unknown error occurred accessing this file'}
+            resp.status = falcon.HTTP_INTERNAL_SERVER_ERROR
+            self.logger.exception(
+                'An unknown error processing file "{}"'.format(filename))
 
     def on_post(self, req, resp, dataset, filename):
         """Post will create new files and adds them to the annex if they do not exist, else update existing files."""
diff --git a/services/datalad/datalad_service/handlers/snapshots.py b/services/datalad/datalad_service/handlers/snapshots.py
index 0d999db5f5..4dd16ceef9 100644
--- a/services/datalad/datalad_service/handlers/snapshots.py
+++ b/services/datalad/datalad_service/handlers/snapshots.py
@@ -4,7 +4,7 @@
 import falcon
 
 from datalad_service.tasks.snapshots import SnapshotDescriptionException, create_snapshot, get_snapshot, get_snapshots, SnapshotExistsException
-from datalad_service.tasks.files import get_files
+from datalad_service.tasks.files import get_tree
 from datalad_service.tasks.publish import export_dataset, monitor_remote_configs
 from datalad_service.common.git import delete_tag
 
@@ -20,8 +20,7 @@ def __init__(self, store):
     def on_get(self, req, resp, dataset, snapshot=None):
         """Get the tree of files for a snapshot."""
         if snapshot:
-            files = get_files(self.store, dataset,
-                              branch=snapshot)
+            files = get_tree(self.store, dataset, snapshot)
             response = get_snapshot(self.store, dataset, snapshot)
             response['files'] = files
             resp.media = response
diff --git a/services/datalad/datalad_service/handlers/tree.py b/services/datalad/datalad_service/handlers/tree.py
new file mode 100644
index 0000000000..6ebde33a05
--- /dev/null
+++ b/services/datalad/datalad_service/handlers/tree.py
@@ -0,0 +1,21 @@
+import logging
+
+import falcon
+
+from datalad_service.tasks.files import get_tree
+
+
+class TreeResource(object):
+    def __init__(self, store):
+        self.store = store
+        self.logger = logging.getLogger('datalad_service.' + __name__)
+
+    def on_get(self, req, resp, dataset, tree):
+        # Request for index of files
+        # Return a list of file objects
+        # {name, path, size}
+        try:
+            files = get_tree(self.store, dataset, tree)
+            resp.media = {'files': files}
+        except:
+            resp.status = falcon.HTTP_INTERNAL_SERVER_ERROR
diff --git a/services/datalad/datalad_service/tasks/files.py b/services/datalad/datalad_service/tasks/files.py
index 49195bc4e0..bc4e803137 100644
--- a/services/datalad/datalad_service/tasks/files.py
+++ b/services/datalad/datalad_service/tasks/files.py
@@ -26,10 +26,10 @@ def commit_files(store, dataset, files, name=None, email=None, cookies=None):
     return ref
 
 
-def get_files(store, dataset, branch=None):
+def get_tree(store, dataset, tree):
     """Get the working tree, optionally a branch tree."""
     dataset_path = store.get_dataset_path(dataset)
-    return get_repo_files(dataset_path, branch)
+    return get_repo_files(dataset_path, tree)
 
 
 def remove_files(store, dataset, paths, name=None, email=None, cookies=None):
diff --git a/services/datalad/datalad_service/tasks/snapshots.py b/services/datalad/datalad_service/tasks/snapshots.py
index 5540237dbe..8c1aeea5ee 100644
--- a/services/datalad/datalad_service/tasks/snapshots.py
+++ b/services/datalad/datalad_service/tasks/snapshots.py
@@ -26,7 +26,8 @@ def get_snapshot(store, dataset, snapshot):
     commit, _ = repo.resolve_refish(snapshot)
     hexsha = commit.hex
     created = commit.commit_time
-    return {'id': '{}:{}'.format(dataset, snapshot), 'tag': snapshot, 'hexsha': hexsha, 'created': created}
+    tree = commit.tree_id.hex
+    return {'id': '{}:{}'.format(dataset, snapshot), 'tag': snapshot, 'hexsha': hexsha, 'created': created, 'tree': tree}
 
 
 def get_snapshots(store, dataset):
diff --git a/services/datalad/tests/test_files.py b/services/datalad/tests/test_files.py
index 82b8f8b21a..db4f8a7fd8 100644
--- a/services/datalad/tests/test_files.py
+++ b/services/datalad/tests/test_files.py
@@ -121,13 +121,11 @@ def test_file_indexing(client, new_dataset):
     response = client.simulate_post('/datasets/{}/draft'.format(ds_id))
     assert response.status == falcon.HTTP_OK
     # Get the files in the committed tree
-    response = client.simulate_get('/datasets/{}/files'.format(ds_id))
-    assert response.status == falcon.HTTP_OK
-    response_content = json.loads(response.content)
-    print('response content:', response_content['files'])
-    print('not annexed files:', new_dataset.repo.is_under_annex(
-        ['dataset_description.json']))
-    assert all(f in response_content['files'] for f in [
+    root_response = client.simulate_get(
+        '/datasets/{}/tree/{}'.format(ds_id, 'HEAD'))
+    assert root_response.status == falcon.HTTP_OK
+    root_content = json.loads(root_response.content)
+    for f in [
         {'filename': 'dataset_description.json', 'size': 101,
             'id': '43502da40903d08b18b533f8897330badd6e1da3',
             'key': '838d19644b3296cf32637bbdf9ae5c87db34842f',
@@ -136,11 +134,27 @@ def test_file_indexing(client, new_dataset):
             'id': '8a6f5281317d8a8fb695d12c940b0ff7a7dee435',
             'key': 'MD5E-s8--4d87586dfb83dc4a5d15c6cfa6f61e27',
             'urls': [], 'annexed': True},
-        {'filename': 'sub-01/anat/sub-01_T1w.nii.gz', 'size': 19,
-            'id': '7fa0e07afaec0ff2cdf1bfc783596b4472df9b12',
+        {'id': '2f8451ae1016f936999aaacc0b3d79fb284ac3ea', 'filename': 'sub-01',
+            'directory': True, 'annexed': False, 'size': 0, 'urls': []}
+    ]:
+        assert f in root_content['files']
+    # Test sub-01 directory
+    sub_response = client.simulate_get(
+        '/datasets/{}/tree/{}'.format(ds_id, next(
+            (f['id'] for f in root_content['files'] if f['filename'] == 'sub-01'), None)))
+    assert sub_response.status == falcon.HTTP_OK
+    sub_content = json.loads(sub_response.content)
+    # Test sub-01/anat directory
+    anat_response = client.simulate_get(
+        '/datasets/{}/tree/{}'.format(ds_id, next(
+            (f['id'] for f in sub_content['files'] if f['filename'] == 'anat'), None)))
+    assert anat_response.status == falcon.HTTP_OK
+    anat_content = json.loads(anat_response.content)
+    # Test sub-01/anat/sub-01_T1w.nii.gz file
+    assert {'filename': 'sub-01/anat/sub-01_T1w.nii.gz', 'size': 19,
+            'id': 'e497096a2bce0d48b2761dade2b5c4e5a0f352bd',
             'key': 'MD5E-s19--8149926e49b677a5ccecf1ad565acccf.nii.gz',
-            'urls': [], 'annexed': True}
-    ])
+            'urls': [], 'annexed': True} in anat_content['files']
 
 
 def test_empty_file(client, new_dataset):
@@ -155,7 +169,7 @@ def test_empty_file(client, new_dataset):
         '/datasets/{}/draft'.format(ds_id), params={"validate": "false"})
     assert response.status == falcon.HTTP_OK
     # Get the files in the committed tree
-    response = client.simulate_get('/datasets/{}/files'.format(ds_id))
+    response = client.simulate_get('/datasets/{}/tree/HEAD'.format(ds_id))
     assert response.status == falcon.HTTP_OK
     response_content = json.loads(response.content)
     # Check that all elements exist in both lists
@@ -181,14 +195,20 @@ def test_duplicate_file_id(client, new_dataset):
     response = client.simulate_post(
         '/datasets/{}/draft'.format(ds_id), params={"validate": "false"})
     assert response.status == falcon.HTTP_OK
-    response = client.simulate_get('/datasets/{}/files'.format(ds_id))
+    response = client.simulate_get('/datasets/{}/tree/HEAD'.format(ds_id))
+    assert response.status == falcon.HTTP_OK
+    response_content = json.loads(response.content)
+    derivatives_tree = next((f['id'] for f in response_content['files']
+                             if f['filename'] == 'derivatives'), None)
+    response = client.simulate_get(
+        '/datasets/{}/tree/{}'.format(ds_id, derivatives_tree))
     assert response.status == falcon.HTTP_OK
     response_content = json.loads(response.content)
     # Find each file in the results
     file_one = next(
-        (f for f in response_content['files'] if f['filename'] == 'derivatives/one.json'), None)
+        (f for f in response_content['files'] if f['filename'] == 'one.json'), None)
     file_two = next(
-        (f for f in response_content['files'] if f['filename'] == 'derivatives/two.json'), None)
+        (f for f in response_content['files'] if f['filename'] == 'two.json'), None)
     # Validate they have differing ids
     assert file_one['id'] != file_two['id']
 

From b4a3cd3222c456410f24f11865c0df6292e18623 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Thu, 29 Sep 2022 16:31:06 -0700
Subject: [PATCH 02/34] refactor(server): Use a git tree object approach for
 file recursion

---
 packages/openneuro-server/src/datalad/files.js    | 15 ++++++---------
 .../openneuro-server/src/datalad/snapshots.js     |  5 +++--
 .../src/graphql/resolvers/draft.js                | 11 +++++------
 .../src/graphql/resolvers/snapshots.js            | 10 +++++-----
 packages/openneuro-server/src/graphql/schema.js   |  5 ++---
 5 files changed, 21 insertions(+), 25 deletions(-)

diff --git a/packages/openneuro-server/src/datalad/files.js b/packages/openneuro-server/src/datalad/files.js
index 3256638970..007f0daa95 100644
--- a/packages/openneuro-server/src/datalad/files.js
+++ b/packages/openneuro-server/src/datalad/files.js
@@ -61,19 +61,17 @@ export const computeTotalSize = files =>
  * Get files for a specific revision
  * Similar to getDraftFiles but different cache key and fixed revisions
  * @param {string} datasetId - Dataset accession number
- * @param {string} hexsha - Git treeish hexsha
+ * @param {string} treeish - Git treeish hexsha
  */
-export const getFiles = (datasetId, hexsha) => {
+export const getFiles = (datasetId, treeish) => {
   const cache = new CacheItem(redis, CacheType.commitFiles, [
     datasetId,
-    hexsha.substring(0, 7),
+    treeish.substring(0, 7),
   ])
   return cache.get(() =>
     request
       .get(
-        `${getDatasetWorker(
-          datasetId,
-        )}/datasets/${datasetId}/snapshots/${hexsha}/files`,
+        `${getDatasetWorker(datasetId)}/datasets/${datasetId}/tree/${treeish}`,
       )
       .set('Accept', 'application/json')
       .then(response => {
@@ -81,10 +79,9 @@ export const getFiles = (datasetId, hexsha) => {
           const {
             body: { files },
           } = response
-          const size = computeTotalSize(files)
           return {
-            files: files.map(addFileUrl(datasetId, hexsha)),
-            size,
+            files: files.map(addFileUrl(datasetId, treeish)),
+            size: 128,
           }
         }
       }),
diff --git a/packages/openneuro-server/src/datalad/snapshots.js b/packages/openneuro-server/src/datalad/snapshots.js
index 23146d4210..d381900b71 100644
--- a/packages/openneuro-server/src/datalad/snapshots.js
+++ b/packages/openneuro-server/src/datalad/snapshots.js
@@ -155,9 +155,10 @@ export const createSnapshot = async (
       snapshotChanges,
     )
     snapshot.created = new Date()
-    const { files, size } = await getFiles(datasetId, tag)
+    const { files } = await getFiles(datasetId, tag)
     snapshot.files = files
-    snapshot.size = size
+    // TODO - Use a different path for size
+    snapshot.size = 128
 
     await Promise.all([
       // Update the draft status in datasets collection in case any changes were made (DOI, License)
diff --git a/packages/openneuro-server/src/graphql/resolvers/draft.js b/packages/openneuro-server/src/graphql/resolvers/draft.js
index 2d185446c7..49928a2371 100644
--- a/packages/openneuro-server/src/graphql/resolvers/draft.js
+++ b/packages/openneuro-server/src/graphql/resolvers/draft.js
@@ -4,21 +4,20 @@ import { description } from './description.js'
 import { readme } from './readme.js'
 import { getDraftRevision, updateDatasetRevision } from '../../datalad/draft.js'
 import { checkDatasetWrite } from '../permissions.js'
-import { getFiles, filterFiles } from '../../datalad/files.js'
+import { getFiles } from '../../datalad/files.js'
 import { filterRemovedAnnexObjects } from '../utils/file.js'
 
 // A draft must have a dataset parent
 const draftFiles = async (dataset, args, { userInfo }) => {
   const hexsha = await getDraftRevision(dataset.id)
-  const { files } = await getFiles(dataset.id, hexsha)
-  const prefixFiltered = filterFiles('prefix' in args && args.prefix)(files)
-  return filterRemovedAnnexObjects(dataset.id, userInfo)(prefixFiltered)
+  const { files } = await getFiles(dataset.id, args.tree || hexsha)
+  return filterRemovedAnnexObjects(dataset.id, userInfo)(files)
 }
 
 const draftSize = async (dataset, args, { userInfo }) => {
   const hexsha = await getDraftRevision(dataset.id)
-  const { size } = await getFiles(dataset.id, hexsha)
-  return size
+  // TODO - Implement a different method for size
+  return 128
 }
 
 /**
diff --git a/packages/openneuro-server/src/graphql/resolvers/snapshots.js b/packages/openneuro-server/src/graphql/resolvers/snapshots.js
index 67892c996b..ebc13295b1 100644
--- a/packages/openneuro-server/src/graphql/resolvers/snapshots.js
+++ b/packages/openneuro-server/src/graphql/resolvers/snapshots.js
@@ -6,7 +6,7 @@ import { readme } from './readme.js'
 import { description } from './description.js'
 import { summary } from './summary.js'
 import { snapshotIssues } from './issues.js'
-import { getFiles, filterFiles } from '../../datalad/files.js'
+import { getFiles } from '../../datalad/files.js'
 import DatasetModel from '../../models/dataset'
 import { filterRemovedAnnexObjects } from '../utils/file.js'
 import DeprecatedSnapshot from '../../models/deprecatedSnapshot'
@@ -28,11 +28,11 @@ export const snapshot = (obj, { datasetId, tag }, context) => {
         description: () => description(snapshot),
         readme: () => readme(snapshot),
         summary: () => summary({ id: datasetId, revision: snapshot.hexsha }),
-        files: ({ prefix }) =>
-          getFiles(datasetId, snapshot.hexsha)
+        files: ({ tree }) => {
+          getFiles(datasetId, tree || snapshot.hexsha)
             .then(response => response.files)
-            .then(filterFiles(prefix))
-            .then(filterRemovedAnnexObjects(datasetId, context.userInfo)),
+            .then(filterRemovedAnnexObjects(datasetId, context.userInfo))
+        },
         size: () =>
           getFiles(datasetId, snapshot.hexsha).then(response => response.size),
         deprecated: () => deprecated({ datasetId, tag }),
diff --git a/packages/openneuro-server/src/graphql/schema.js b/packages/openneuro-server/src/graphql/schema.js
index 86316914a4..e316c8db9d 100644
--- a/packages/openneuro-server/src/graphql/schema.js
+++ b/packages/openneuro-server/src/graphql/schema.js
@@ -434,7 +434,7 @@ export const typeDefs = `
     # Validator issues
     issues: [ValidationIssue]
     # Committed files in the working tree
-    files(prefix: String = ""): [DatasetFile]
+    files(tree: String): [DatasetFile]
     # dataset_description.json fields
     description: Description
     # Dataset README
@@ -461,7 +461,7 @@ export const typeDefs = `
     # bids-validator issues for this snapshot
     issues: [ValidationIssue]
     # Snapshot files
-    files(prefix: String = ""): [DatasetFile]
+    files(tree: String): [DatasetFile]
     # dataset_description.json fields
     description: Description
     # Snapshot usage and download statistics
@@ -689,7 +689,6 @@ export const typeDefs = `
     size: BigInt
     annexed: Boolean
     urls: [String]
-    objectpath: String
     # Return a flag if this is a directory which contains more files
     directory: Boolean
   }

From f4a3aa77603acd6ef3144b4ff09642ad1a60c264 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Thu, 29 Sep 2022 16:31:30 -0700
Subject: [PATCH 03/34] refactor(app): Adopt git tree loading for dataset page
 file tree

---
 .../files/__tests__/flat-to-tree.spec.js      |  55 ---------
 .../files/file-tree-unloaded-directory.jsx    |  44 ++++---
 .../src/scripts/dataset/files/file-tree.jsx   | 110 +++++++++++-------
 .../src/scripts/dataset/files/files.jsx       |   8 +-
 .../src/scripts/dataset/files/flat-to-tree.js |  49 --------
 5 files changed, 94 insertions(+), 172 deletions(-)
 delete mode 100644 packages/openneuro-app/src/scripts/dataset/files/__tests__/flat-to-tree.spec.js
 delete mode 100644 packages/openneuro-app/src/scripts/dataset/files/flat-to-tree.js

diff --git a/packages/openneuro-app/src/scripts/dataset/files/__tests__/flat-to-tree.spec.js b/packages/openneuro-app/src/scripts/dataset/files/__tests__/flat-to-tree.spec.js
deleted file mode 100644
index 8ca64c93f8..0000000000
--- a/packages/openneuro-app/src/scripts/dataset/files/__tests__/flat-to-tree.spec.js
+++ /dev/null
@@ -1,55 +0,0 @@
-import { flatToTree } from '../flat-to-tree.js'
-
-const CHANGES = Object.freeze({
-  id: '3d9b15b3ef4e9da06e265e6078d3b4ddf8495102',
-  filename: 'CHANGES',
-  size: 39,
-})
-
-const nifti = Object.freeze({
-  id: '50512c7261fc006eb59bfd16f2a9d3140c9efe62',
-  filename: 'sub-01/anat/sub-01_T1w.nii.gz',
-  size: 311112,
-})
-
-const sub01Unloaded = Object.freeze({
-  id: 'directory:sub-01',
-  filename: 'sub-01',
-  size: 1,
-  directory: true,
-})
-
-const exampleFiles = [CHANGES, nifti]
-
-describe('FileTree', () => {
-  describe('flatToTree()', () => {
-    it('accepts an array and returns a tree', () => {
-      expect(flatToTree(exampleFiles)).toEqual({
-        name: '',
-        files: [CHANGES],
-        directories: [
-          {
-            name: 'sub-01',
-            path: 'sub-01',
-            files: [],
-            directories: [
-              {
-                name: 'anat',
-                path: 'sub-01:anat',
-                files: [{ ...nifti, filename: 'sub-01_T1w.nii.gz' }],
-                directories: [],
-              },
-            ],
-          },
-        ],
-      })
-    })
-    it('accepts directory stubs and returns them as directories', () => {
-      expect(flatToTree([CHANGES, sub01Unloaded])).toEqual({
-        name: '',
-        files: [CHANGES],
-        directories: [{ ...sub01Unloaded, name: sub01Unloaded.filename }],
-      })
-    })
-  })
-})
diff --git a/packages/openneuro-app/src/scripts/dataset/files/file-tree-unloaded-directory.jsx b/packages/openneuro-app/src/scripts/dataset/files/file-tree-unloaded-directory.jsx
index 4d85da1408..cbf0918d9c 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/file-tree-unloaded-directory.jsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/file-tree-unloaded-directory.jsx
@@ -6,10 +6,10 @@ import { gql } from '@apollo/client'
 import { AccordionTab } from '@openneuro/components/accordion'
 
 export const DRAFT_FILES_QUERY = gql`
-  query dataset($datasetId: ID!, $filePrefix: String!) {
+  query dataset($datasetId: ID!, $tree: String!) {
     dataset(id: $datasetId) {
       draft {
-        files(prefix: $filePrefix) {
+        files(tree: $tree) {
           id
           key
           filename
@@ -23,9 +23,9 @@ export const DRAFT_FILES_QUERY = gql`
 `
 
 export const SNAPSHOT_FILES_QUERY = gql`
-  query snapshot($datasetId: ID!, $snapshotTag: String!, $filePrefix: String!) {
+  query snapshot($datasetId: ID!, $snapshotTag: String!, $tree: String!) {
     snapshot(datasetId: $datasetId, tag: $snapshotTag) {
-      files(prefix: $filePrefix) {
+      files(tree: $tree) {
         id
         key
         filename
@@ -37,24 +37,30 @@ export const SNAPSHOT_FILES_QUERY = gql`
   }
 `
 
+/**
+ * Prepend paths to the tree object returned to get absolute filenames
+ */
+export const nestFiles = path => file => ({
+  ...file,
+  filename: `${path}:${file.filename}`,
+})
+
+/**
+ * Merge cached dataset files with newly received data
+ */
 export const mergeNewFiles =
   (directory, snapshotTag) =>
   (past, { fetchMoreResult }) => {
     // Deep clone the old dataset object
+    const path = directory.filename
     const newDatasetObj = JSON.parse(JSON.stringify(past))
-    const mergeNewFileFilter = f => f.id !== directory.id
-    // Remove ourselves from the array
-    if (snapshotTag) {
-      newDatasetObj.snapshot.files =
-        newDatasetObj.snapshot.files.filter(mergeNewFileFilter)
-      newDatasetObj.snapshot.files.push(...fetchMoreResult.snapshot.files)
-    } else {
-      newDatasetObj.dataset.draft.files =
-        newDatasetObj.dataset.draft.files.filter(mergeNewFileFilter)
-      newDatasetObj.dataset.draft.files.push(
-        ...fetchMoreResult.dataset.draft.files,
-      )
-    }
+    const newFiles = snapshotTag
+      ? newDatasetObj.snapshot.files
+      : newDatasetObj.dataset.draft.files
+    const fetchMoreData = snapshotTag
+      ? fetchMoreResult.snapshot
+      : fetchMoreResult.dataset.draft
+    newFiles.push(...fetchMoreData.files.map(nestFiles(path)))
     return newDatasetObj
   }
 
@@ -66,7 +72,7 @@ export const fetchMoreDirectory = (
 ) =>
   fetchMore({
     query: snapshotTag ? SNAPSHOT_FILES_QUERY : DRAFT_FILES_QUERY,
-    variables: { datasetId, snapshotTag, filePrefix: directory.filename + '/' },
+    variables: { datasetId, snapshotTag, tree: directory.id },
     updateQuery: mergeNewFiles(directory, snapshotTag),
   })
 
@@ -82,7 +88,7 @@ const FileTreeUnloadedDirectory = ({ datasetId, snapshotTag, directory }) => {
   }, [loading])
   return (
     <AccordionTab
-      label={directory.filename}
+      label={directory.filename.split(':').pop()}
       accordionStyle="file-tree"
       onClick={() => {
         // Show a loading state while we wait on the directory to stream in
diff --git a/packages/openneuro-app/src/scripts/dataset/files/file-tree.jsx b/packages/openneuro-app/src/scripts/dataset/files/file-tree.jsx
index c6d62f5bc0..3d8cdbd4cc 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/file-tree.jsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/file-tree.jsx
@@ -7,21 +7,14 @@ import FileTreeUnloadedDirectory from './file-tree-unloaded-directory.jsx'
 import { Media } from '../../styles/media'
 import { AccordionTab } from '@openneuro/components/accordion'
 
-export const sortByFilename = (a, b) => a.filename.localeCompare(b.filename)
-
-export const sortByName = (a, b) => a.name.localeCompare(b.name)
-
 export const unescapePath = path => path.replace(/:/g, '/')
 
-const isTopLevel = dir => !dir.path.includes(':')
-
 const FileTree = ({
   datasetId,
   snapshotTag = null,
   path = '',
   name = '',
   files = [],
-  directories = [],
   editMode = false,
   defaultExpanded = false,
   datasetPermissions,
@@ -29,10 +22,33 @@ const FileTree = ({
   isFileToBeDeleted,
   bulkDeleteButton,
 }) => {
+  // Split files into a tree for this level and child levels
+  // Special cases for root (path === '')
+  const currentFiles = []
+  const childFiles = {}
+  for (const f of files) {
+    // Any paths in this filename below the current path value
+    const lowerPath = f.filename.substring(`${path}:`.length)
+    if (path === '' ? f.filename.includes(':') : lowerPath.includes(':')) {
+      // At the top level, use the directory component (first segment)
+      // Below that, use all paths before the filename (sub-01:anat) for (sub-01:anat:sub-01_T1w.nii.gz)
+      const childPath =
+        path === ''
+          ? f.filename.split(':')[0]
+          : f.filename.split(':').slice(0, -1).join(':')
+      if (childFiles.hasOwnProperty(childPath)) {
+        childFiles[childPath].push(f)
+      } else {
+        childFiles[childPath] = [f]
+      }
+    } else {
+      currentFiles.push(f)
+    }
+  }
   return (
     <AccordionTab
       className=""
-      label={name}
+      label={name || path.split(':').pop()}
       accordionStyle="file-tree"
       startOpen={defaultExpanded}>
       {editMode && (
@@ -59,48 +75,50 @@ const FileTree = ({
         </Media>
       )}
       <ul className="child-files">
-        {files.sort(sortByFilename).map((file, index) => (
-          <li className="clearfix filetree-item filetree-file" key={index}>
-            <File
-              id={file.id}
-              datasetId={datasetId}
-              snapshotTag={snapshotTag}
-              path={path}
-              size={file.size}
-              editMode={editMode}
-              toggleFileToDelete={toggleFileToDelete}
-              isFileToBeDeleted={isFileToBeDeleted}
-              {...file}
-              annexKey={file.key}
-              datasetPermissions={datasetPermissions}
-            />
-          </li>
-        ))}
-        {directories.sort(sortByName).map((dir, index) => {
-          if ('files' in dir || 'directories' in dir) {
-            // Loaded directory
+        {currentFiles.map((file, index) => {
+          if (file.directory) {
+            if (childFiles.hasOwnProperty(file.filename)) {
+              return (
+                <li className="clearfix filetree-item filetree-dir" key={index}>
+                  <FileTree
+                    datasetId={datasetId}
+                    snapshotTag={snapshotTag}
+                    editMode={editMode}
+                    defaultExpanded={true}
+                    datasetPermissions={datasetPermissions}
+                    toggleFileToDelete={toggleFileToDelete}
+                    isFileToBeDeleted={isFileToBeDeleted}
+                    files={childFiles[file.filename]}
+                    path={file.filename}
+                  />
+                </li>
+              )
+            } else {
+              return (
+                <li className="clearfix filetree-item filetree-dir" key={index}>
+                  <FileTreeUnloadedDirectory
+                    datasetId={datasetId}
+                    snapshotTag={snapshotTag}
+                    directory={file}
+                  />
+                </li>
+              )
+            }
+          } else {
             return (
-              <li className="clearfix filetree-item filetree-dir" key={index}>
-                <FileTree
+              <li className="clearfix filetree-item filetree-file" key={index}>
+                <File
+                  id={file.id}
                   datasetId={datasetId}
                   snapshotTag={snapshotTag}
+                  path={path}
+                  size={file.size}
                   editMode={editMode}
-                  defaultExpanded={isTopLevel(dir)}
-                  datasetPermissions={datasetPermissions}
                   toggleFileToDelete={toggleFileToDelete}
                   isFileToBeDeleted={isFileToBeDeleted}
-                  {...dir}
-                />
-              </li>
-            )
-          } else {
-            // Unloaded
-            return (
-              <li className="clearfix filetree-item filetree-dir" key={index}>
-                <FileTreeUnloadedDirectory
-                  datasetId={datasetId}
-                  snapshotTag={snapshotTag}
-                  directory={dir}
+                  filename={file.filename.split(':').pop()}
+                  annexKey={file.key}
+                  datasetPermissions={datasetPermissions}
                 />
               </li>
             )
@@ -117,10 +135,12 @@ FileTree.propTypes = {
   snapshotTag: PropTypes.string,
   path: PropTypes.string,
   name: PropTypes.string,
-  directories: PropTypes.array,
   editMode: PropTypes.bool,
   defaultExpanded: PropTypes.bool,
   datasetPermissions: PropTypes.object,
+  toggleFileToDelete: PropTypes.func,
+  isFileToBeDeleted: PropTypes.func,
+  bulkDeleteButton: PropTypes.func,
 }
 
 export default FileTree
diff --git a/packages/openneuro-app/src/scripts/dataset/files/files.jsx b/packages/openneuro-app/src/scripts/dataset/files/files.jsx
index 016b717a9a..86883f9d32 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/files.jsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/files.jsx
@@ -1,6 +1,5 @@
 import React, { useState } from 'react'
 import PropTypes from 'prop-types'
-import { flatToTree } from './flat-to-tree.js'
 import FileTree from './file-tree.jsx'
 import { Media } from '../../styles/media'
 import { useMutation, gql } from '@apollo/client'
@@ -32,6 +31,8 @@ const DELETE_FILES = gql`
     deleteFiles(datasetId: $datasetId, files: $files)
   }
 `
+export const sortByFilename = (a, b) =>
+  a.filename.localeCompare(b.filename, { numeric: true })
 
 const Files = ({
   datasetId,
@@ -72,7 +73,6 @@ const Files = ({
     }
   }
 
-  const fileTree = flatToTree(files)
   const disableBtn = Object.values(filesToDelete).length ? null : true
   const filesCount = Object.values(filesToDelete).length
   const bulkDeleteButton =
@@ -108,7 +108,7 @@ const Files = ({
               datasetId={datasetId}
               snapshotTag={snapshotTag}
               path={''}
-              {...fileTree}
+              files={[...files].sort(sortByFilename)}
               name={datasetName}
               editMode={editMode}
               defaultExpanded={false}
@@ -133,7 +133,7 @@ const Files = ({
               datasetId={datasetId}
               snapshotTag={snapshotTag}
               path={''}
-              {...fileTree}
+              files={files}
               name={datasetName}
               editMode={editMode}
               defaultExpanded={true}
diff --git a/packages/openneuro-app/src/scripts/dataset/files/flat-to-tree.js b/packages/openneuro-app/src/scripts/dataset/files/flat-to-tree.js
deleted file mode 100644
index 893ce87b83..0000000000
--- a/packages/openneuro-app/src/scripts/dataset/files/flat-to-tree.js
+++ /dev/null
@@ -1,49 +0,0 @@
-/**
- * Takes an array of files and returns a tree representation
- * @param {array} files
- */
-export const flatToTree = files => {
-  const tree = { name: '', files: [], directories: [] }
-  for (const file of files) {
-    const pathTokens = file.filename.split('/')
-    const lastPath = pathTokens.slice(-1).pop()
-    if (pathTokens.length === 1) {
-      // Top level file or directory stub
-      if (file.directory) {
-        tree.directories.push({ ...file, name: file.filename })
-      } else {
-        tree.files.push({ ...file })
-      }
-    } else {
-      // File in a directory
-      let directory = tree
-      for (const token of pathTokens) {
-        if (token === lastPath) {
-          // Leaf (file)
-          directory.files.push({
-            ...file,
-            filename: lastPath,
-          })
-        } else {
-          const newDir = directory.directories.find(dir => dir.name === token)
-          if (newDir) {
-            // Already exists, keep going
-            directory = newDir
-          } else {
-            // Create the missing directory
-            const createDir = {
-              name: token,
-              path: `${(directory.path && directory.path + ':') || ''}${token}`,
-              files: [],
-              directories: [],
-            }
-            directory.directories.push(createDir)
-            directory = createDir
-          }
-        }
-      }
-      tree.directories
-    }
-  }
-  return tree
-}

From 0b4a26ed3963a42d8b6321eeb205be5be7f350f2 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Fri, 30 Sep 2022 08:35:24 -0700
Subject: [PATCH 04/34] fix(app): Convert FileTree to TypeScript

---
 .../files/{file-tree.jsx => file-tree.tsx}    | 42 +++++++++++--------
 .../src/scripts/dataset/files/files.jsx       |  2 +-
 2 files changed, 26 insertions(+), 18 deletions(-)
 rename packages/openneuro-app/src/scripts/dataset/files/{file-tree.jsx => file-tree.tsx} (87%)

diff --git a/packages/openneuro-app/src/scripts/dataset/files/file-tree.jsx b/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
similarity index 87%
rename from packages/openneuro-app/src/scripts/dataset/files/file-tree.jsx
rename to packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
index 3d8cdbd4cc..22fc89d410 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/file-tree.jsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
@@ -1,5 +1,4 @@
 import React from 'react'
-import PropTypes from 'prop-types'
 import File from './file'
 import UpdateFile from '../mutations/update-file.jsx'
 import DeleteDir from '../mutations/delete-dir.jsx'
@@ -7,7 +6,26 @@ import FileTreeUnloadedDirectory from './file-tree-unloaded-directory.jsx'
 import { Media } from '../../styles/media'
 import { AccordionTab } from '@openneuro/components/accordion'
 
-export const unescapePath = path => path.replace(/:/g, '/')
+export const unescapePath = (path: string): string => path.replace(/:/g, '/')
+
+interface FileTreeProps {
+  datasetId: string
+  snapshotTag: string
+  path: string
+  name: string
+  files: Array<{
+    id: string
+    filename: string
+    key: string
+    size: number
+  }>
+  editMode: boolean
+  defaultExpanded: boolean
+  datasetPermissions: any
+  toggleFileToDelete: () => void
+  isFileToBeDeleted: boolean
+  bulkDeleteButton: React.ReactElement
+}
 
 const FileTree = ({
   datasetId,
@@ -21,7 +39,7 @@ const FileTree = ({
   toggleFileToDelete,
   isFileToBeDeleted,
   bulkDeleteButton,
-}) => {
+}: FileTreeProps): React.ReactElement => {
   // Split files into a tree for this level and child levels
   // Special cases for root (path === '')
   const currentFiles = []
@@ -90,6 +108,8 @@ const FileTree = ({
                     isFileToBeDeleted={isFileToBeDeleted}
                     files={childFiles[file.filename]}
                     path={file.filename}
+                    name={file.filename}
+                    bulkDeleteButton={bulkDeleteButton}
                   />
                 </li>
               )
@@ -119,6 +139,8 @@ const FileTree = ({
                   filename={file.filename.split(':').pop()}
                   annexKey={file.key}
                   datasetPermissions={datasetPermissions}
+                  annexed={file.key}
+                  isMobile={false}
                 />
               </li>
             )
@@ -129,18 +151,4 @@ const FileTree = ({
   )
 }
 
-FileTree.propTypes = {
-  datasetId: PropTypes.string,
-  files: PropTypes.array,
-  snapshotTag: PropTypes.string,
-  path: PropTypes.string,
-  name: PropTypes.string,
-  editMode: PropTypes.bool,
-  defaultExpanded: PropTypes.bool,
-  datasetPermissions: PropTypes.object,
-  toggleFileToDelete: PropTypes.func,
-  isFileToBeDeleted: PropTypes.func,
-  bulkDeleteButton: PropTypes.func,
-}
-
 export default FileTree
diff --git a/packages/openneuro-app/src/scripts/dataset/files/files.jsx b/packages/openneuro-app/src/scripts/dataset/files/files.jsx
index 86883f9d32..103f44e32e 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/files.jsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/files.jsx
@@ -1,6 +1,6 @@
 import React, { useState } from 'react'
 import PropTypes from 'prop-types'
-import FileTree from './file-tree.jsx'
+import FileTree from './file-tree'
 import { Media } from '../../styles/media'
 import { useMutation, gql } from '@apollo/client'
 import { WarnButton } from '@openneuro/components/warn-button'

From 2928632aeaef78be0c3a83ce462dab916e3ae488 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Fri, 30 Sep 2022 08:35:41 -0700
Subject: [PATCH 05/34] fix(worker): Revert test example for full vs basename
 paths

---
 services/datalad/tests/test_files.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/services/datalad/tests/test_files.py b/services/datalad/tests/test_files.py
index db4f8a7fd8..3823287934 100644
--- a/services/datalad/tests/test_files.py
+++ b/services/datalad/tests/test_files.py
@@ -151,7 +151,7 @@ def test_file_indexing(client, new_dataset):
     assert anat_response.status == falcon.HTTP_OK
     anat_content = json.loads(anat_response.content)
     # Test sub-01/anat/sub-01_T1w.nii.gz file
-    assert {'filename': 'sub-01/anat/sub-01_T1w.nii.gz', 'size': 19,
+    assert {'filename': 'sub-01_T1w.nii.gz', 'size': 19,
             'id': 'e497096a2bce0d48b2761dade2b5c4e5a0f352bd',
             'key': 'MD5E-s19--8149926e49b677a5ccecf1ad565acccf.nii.gz',
             'urls': [], 'annexed': True} in anat_content['files']

From e2d4ed95f34b46c3f046250015ccd46ce70e9c84 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Fri, 30 Sep 2022 08:49:56 -0700
Subject: [PATCH 06/34] fix(app): Convert Files component to TypeScript

---
 .../src/scripts/dataset/files/file-tree.tsx   | 12 +++-----
 .../dataset/files/{files.jsx => files.tsx}    | 30 +++++++++++++------
 2 files changed, 25 insertions(+), 17 deletions(-)
 rename packages/openneuro-app/src/scripts/dataset/files/{files.jsx => files.tsx} (86%)

diff --git a/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx b/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
index 22fc89d410..9188f23358 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
@@ -5,6 +5,7 @@ import DeleteDir from '../mutations/delete-dir.jsx'
 import FileTreeUnloadedDirectory from './file-tree-unloaded-directory.jsx'
 import { Media } from '../../styles/media'
 import { AccordionTab } from '@openneuro/components/accordion'
+import { DatasetFile } from '../../types/dataset-file'
 
 export const unescapePath = (path: string): string => path.replace(/:/g, '/')
 
@@ -13,17 +14,12 @@ interface FileTreeProps {
   snapshotTag: string
   path: string
   name: string
-  files: Array<{
-    id: string
-    filename: string
-    key: string
-    size: number
-  }>
+  files: DatasetFile[]
   editMode: boolean
   defaultExpanded: boolean
   datasetPermissions: any
-  toggleFileToDelete: () => void
-  isFileToBeDeleted: boolean
+  toggleFileToDelete: ({ id, path, filename }) => void
+  isFileToBeDeleted: (id: string) => boolean
   bulkDeleteButton: React.ReactElement
 }
 
diff --git a/packages/openneuro-app/src/scripts/dataset/files/files.jsx b/packages/openneuro-app/src/scripts/dataset/files/files.tsx
similarity index 86%
rename from packages/openneuro-app/src/scripts/dataset/files/files.jsx
rename to packages/openneuro-app/src/scripts/dataset/files/files.tsx
index 103f44e32e..81a4eac08b 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/files.jsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/files.tsx
@@ -7,6 +7,7 @@ import { WarnButton } from '@openneuro/components/warn-button'
 import { AccordionWrap } from '@openneuro/components/accordion'
 import styled from '@emotion/styled'
 import { Tooltip } from '@openneuro/components/tooltip'
+import { DatasetFile } from '../../types/dataset-file'
 import bytes from 'bytes'
 
 const FileTreeMeta = styled.span`
@@ -31,8 +32,19 @@ const DELETE_FILES = gql`
     deleteFiles(datasetId: $datasetId, files: $files)
   }
 `
-export const sortByFilename = (a, b) =>
-  a.filename.localeCompare(b.filename, { numeric: true })
+
+export const sortByFilename = (a: DatasetFile, b: DatasetFile): number =>
+  a.filename.localeCompare(b.filename, { numeric: true }) as number
+
+interface FilesProps {
+  datasetId: string
+  snapshotTag: string
+  datasetName: string
+  files: DatasetFile[]
+  editMode: boolean
+  datasetPermissions: any
+  summary: any
+}
 
 const Files = ({
   datasetId,
@@ -42,14 +54,14 @@ const Files = ({
   editMode = false,
   datasetPermissions,
   summary,
-}) => {
+}: FilesProps): React.ReactNode => {
   const [filesToDelete, setFilesToDelete] = useState({})
   const [isDeleting, setIsDeleting] = useState(false)
   const [deleteFiles] = useMutation(DELETE_FILES)
 
-  const isFileToBeDeleted = id => id in filesToDelete
+  const isFileToBeDeleted = (id: string): boolean => id in filesToDelete
 
-  const toggleFileToDelete = ({ id, path, filename }) =>
+  const toggleFileToDelete = ({ id, path, filename }): void =>
     setFilesToDelete(prevFilesToDelete => {
       if (isFileToBeDeleted(id)) {
         delete prevFilesToDelete[id]
@@ -61,10 +73,10 @@ const Files = ({
       }
     })
 
-  const bulkDelete = () => {
+  const bulkDelete = (): void => {
     if (Object.values(filesToDelete).length) {
       setIsDeleting(true)
-      deleteFiles({
+      void deleteFiles({
         variables: { datasetId, files: Object.values(filesToDelete) },
       }).then(() => {
         setIsDeleting(false)
@@ -88,11 +100,11 @@ const Files = ({
             </Tooltip>
           ) : (
             <WarnButton
-              message={'Bulk Delete (' + filesCount + ')'}
+              message={`Bulk Delete (${filesCount})`}
               icon="fas fa-dumpster"
               iconOnly={true}
               className="edit-file"
-              tooltip={'Delete ' + filesCount}
+              tooltip={`Delete ${filesCount}`}
               onConfirmedClick={bulkDelete}
             />
           )}

From 8b9284f647909db0b3e24be995ccaccca6ef3dd6 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Fri, 30 Sep 2022 08:55:09 -0700
Subject: [PATCH 07/34] types: Add DatasetFile type for API file listings

---
 .../openneuro-app/src/scripts/types/dataset-file.ts   | 11 +++++++++++
 1 file changed, 11 insertions(+)
 create mode 100644 packages/openneuro-app/src/scripts/types/dataset-file.ts

diff --git a/packages/openneuro-app/src/scripts/types/dataset-file.ts b/packages/openneuro-app/src/scripts/types/dataset-file.ts
new file mode 100644
index 0000000000..285ca3b526
--- /dev/null
+++ b/packages/openneuro-app/src/scripts/types/dataset-file.ts
@@ -0,0 +1,11 @@
+// Temporary type representing the GraphQL DatasetFile type
+// TODO - Derive this from the GraphQL schema
+interface DatasetFile {
+  id: string
+  key?: string
+  filename: string
+  size?: bigint
+  annexed?: boolean
+  urls?: string[]
+  directory?: boolean
+}

From c3303a215700c16e0e2b1b0c5fcc114a80f39c6f Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Fri, 30 Sep 2022 08:55:33 -0700
Subject: [PATCH 08/34] fix(app): Fix nested directory names to show only
 filename

---
 .../openneuro-app/src/scripts/dataset/files/file-tree.tsx     | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx b/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
index 9188f23358..10c0f8fbc7 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
@@ -62,7 +62,7 @@ const FileTree = ({
   return (
     <AccordionTab
       className=""
-      label={name || path.split(':').pop()}
+      label={name}
       accordionStyle="file-tree"
       startOpen={defaultExpanded}>
       {editMode && (
@@ -104,7 +104,7 @@ const FileTree = ({
                     isFileToBeDeleted={isFileToBeDeleted}
                     files={childFiles[file.filename]}
                     path={file.filename}
-                    name={file.filename}
+                    name={file.filename.split(':').pop()}
                     bulkDeleteButton={bulkDeleteButton}
                   />
                 </li>

From c8ffa2076154be894793904c046ea46b193b9d37 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Fri, 30 Sep 2022 09:23:02 -0700
Subject: [PATCH 09/34] fix(app): TypeScript build fixes for file tree
 components

---
 .../openneuro-app/src/scripts/dataset/files/file-tree.tsx     | 4 ++--
 packages/openneuro-app/src/scripts/dataset/files/file.tsx     | 2 +-
 packages/openneuro-app/src/scripts/dataset/files/files.tsx    | 4 ++--
 packages/openneuro-app/src/scripts/types/dataset-file.ts      | 2 +-
 4 files changed, 6 insertions(+), 6 deletions(-)

diff --git a/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx b/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
index 10c0f8fbc7..6a4397cbf6 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
@@ -20,7 +20,7 @@ interface FileTreeProps {
   datasetPermissions: any
   toggleFileToDelete: ({ id, path, filename }) => void
   isFileToBeDeleted: (id: string) => boolean
-  bulkDeleteButton: React.ReactElement
+  bulkDeleteButton: JSX.Element
 }
 
 const FileTree = ({
@@ -35,7 +35,7 @@ const FileTree = ({
   toggleFileToDelete,
   isFileToBeDeleted,
   bulkDeleteButton,
-}: FileTreeProps): React.ReactElement => {
+}: FileTreeProps): JSX.Element => {
   // Split files into a tree for this level and child levels
   // Special cases for root (path === '')
   const currentFiles = []
diff --git a/packages/openneuro-app/src/scripts/dataset/files/file.tsx b/packages/openneuro-app/src/scripts/dataset/files/file.tsx
index b38a01f1fb..3c1d97420b 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/file.tsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/file.tsx
@@ -99,7 +99,7 @@ interface FileProps {
     id: string
     path: string
     filename: string
-  }) => boolean
+  }) => void
   isFileToBeDeleted: (id: string) => boolean
 }
 
diff --git a/packages/openneuro-app/src/scripts/dataset/files/files.tsx b/packages/openneuro-app/src/scripts/dataset/files/files.tsx
index 81a4eac08b..6e246b512c 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/files.tsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/files.tsx
@@ -34,7 +34,7 @@ const DELETE_FILES = gql`
 `
 
 export const sortByFilename = (a: DatasetFile, b: DatasetFile): number =>
-  a.filename.localeCompare(b.filename, { numeric: true }) as number
+  a.filename.localeCompare(b.filename)
 
 interface FilesProps {
   datasetId: string
@@ -54,7 +54,7 @@ const Files = ({
   editMode = false,
   datasetPermissions,
   summary,
-}: FilesProps): React.ReactNode => {
+}: FilesProps): JSX.Element => {
   const [filesToDelete, setFilesToDelete] = useState({})
   const [isDeleting, setIsDeleting] = useState(false)
   const [deleteFiles] = useMutation(DELETE_FILES)
diff --git a/packages/openneuro-app/src/scripts/types/dataset-file.ts b/packages/openneuro-app/src/scripts/types/dataset-file.ts
index 285ca3b526..b540668ee0 100644
--- a/packages/openneuro-app/src/scripts/types/dataset-file.ts
+++ b/packages/openneuro-app/src/scripts/types/dataset-file.ts
@@ -1,6 +1,6 @@
 // Temporary type representing the GraphQL DatasetFile type
 // TODO - Derive this from the GraphQL schema
-interface DatasetFile {
+export interface DatasetFile {
   id: string
   key?: string
   filename: string

From 10f96fb64725219f1b3994acd3352939ff683794 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Fri, 30 Sep 2022 09:31:49 -0700
Subject: [PATCH 10/34] fix(worker): Avoid looking up URLs for tree objects

---
 services/datalad/datalad_service/common/annex.py | 11 ++++++-----
 1 file changed, 6 insertions(+), 5 deletions(-)

diff --git a/services/datalad/datalad_service/common/annex.py b/services/datalad/datalad_service/common/annex.py
index 1a8fc84b2e..a9d71eab97 100644
--- a/services/datalad/datalad_service/common/annex.py
+++ b/services/datalad/datalad_service/common/annex.py
@@ -143,11 +143,12 @@ def get_repo_urls(path, files):
     rmetPaths = []
     rmetFiles = {}
     for f in files:
-        rmetPath = compute_rmet(f['key'])
-        if rmetPath in rmetObjects:
-            # Keep a reference to the files so we can add URLs later
-            rmetFiles[rmetPath] = f
-            rmetPaths.append(rmetPath)
+        if 'key' in f:
+            rmetPath = compute_rmet(f['key'])
+            if rmetPath in rmetObjects:
+                # Keep a reference to the files so we can add URLs later
+                rmetFiles[rmetPath] = f
+                rmetPaths.append(rmetPath)
     # Then read those objects with git cat-file --batch
     gitObjects = rmetObjects['remote.log'] + '\n' + \
         '\n'.join(rmetObjects[rmetPath] for rmetPath in rmetPaths)

From 1598c577f672cc33f4b8fd2ca7ec121166c789ce Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 09:34:21 -0700
Subject: [PATCH 11/34] fix(api): Simplify getFiles to only return file
 listings

---
 packages/openneuro-server/src/datalad/description.js     | 1 -
 packages/openneuro-server/src/datalad/files.js           | 5 +----
 packages/openneuro-server/src/datalad/snapshots.js       | 3 +--
 packages/openneuro-server/src/graphql/resolvers/draft.js | 2 +-
 .../openneuro-server/src/graphql/resolvers/snapshots.js  | 9 ++++-----
 5 files changed, 7 insertions(+), 13 deletions(-)

diff --git a/packages/openneuro-server/src/datalad/description.js b/packages/openneuro-server/src/datalad/description.js
index 4687a1fde4..48429c331a 100644
--- a/packages/openneuro-server/src/datalad/description.js
+++ b/packages/openneuro-server/src/datalad/description.js
@@ -127,7 +127,6 @@ export const description = obj => {
   return cache
     .get(() => {
       return getFiles(datasetId, revision)
-        .then(response => response.files)
         .then(getDescriptionObject(datasetId))
         .then(uncachedDescription => ({ id: revision, ...uncachedDescription }))
     })
diff --git a/packages/openneuro-server/src/datalad/files.js b/packages/openneuro-server/src/datalad/files.js
index 007f0daa95..f1f45af6e5 100644
--- a/packages/openneuro-server/src/datalad/files.js
+++ b/packages/openneuro-server/src/datalad/files.js
@@ -79,10 +79,7 @@ export const getFiles = (datasetId, treeish) => {
           const {
             body: { files },
           } = response
-          return {
-            files: files.map(addFileUrl(datasetId, treeish)),
-            size: 128,
-          }
+          return files.map(addFileUrl(datasetId, treeish))
         }
       }),
   )
diff --git a/packages/openneuro-server/src/datalad/snapshots.js b/packages/openneuro-server/src/datalad/snapshots.js
index d381900b71..473fededa2 100644
--- a/packages/openneuro-server/src/datalad/snapshots.js
+++ b/packages/openneuro-server/src/datalad/snapshots.js
@@ -155,8 +155,7 @@ export const createSnapshot = async (
       snapshotChanges,
     )
     snapshot.created = new Date()
-    const { files } = await getFiles(datasetId, tag)
-    snapshot.files = files
+    snapshot.files = await getFiles(datasetId, tag)
     // TODO - Use a different path for size
     snapshot.size = 128
 
diff --git a/packages/openneuro-server/src/graphql/resolvers/draft.js b/packages/openneuro-server/src/graphql/resolvers/draft.js
index 49928a2371..6f7bd14146 100644
--- a/packages/openneuro-server/src/graphql/resolvers/draft.js
+++ b/packages/openneuro-server/src/graphql/resolvers/draft.js
@@ -10,7 +10,7 @@ import { filterRemovedAnnexObjects } from '../utils/file.js'
 // A draft must have a dataset parent
 const draftFiles = async (dataset, args, { userInfo }) => {
   const hexsha = await getDraftRevision(dataset.id)
-  const { files } = await getFiles(dataset.id, args.tree || hexsha)
+  const files = await getFiles(dataset.id, args.tree || hexsha)
   return filterRemovedAnnexObjects(dataset.id, userInfo)(files)
 }
 
diff --git a/packages/openneuro-server/src/graphql/resolvers/snapshots.js b/packages/openneuro-server/src/graphql/resolvers/snapshots.js
index ebc13295b1..adca301579 100644
--- a/packages/openneuro-server/src/graphql/resolvers/snapshots.js
+++ b/packages/openneuro-server/src/graphql/resolvers/snapshots.js
@@ -28,11 +28,10 @@ export const snapshot = (obj, { datasetId, tag }, context) => {
         description: () => description(snapshot),
         readme: () => readme(snapshot),
         summary: () => summary({ id: datasetId, revision: snapshot.hexsha }),
-        files: ({ tree }) => {
-          getFiles(datasetId, tree || snapshot.hexsha)
-            .then(response => response.files)
-            .then(filterRemovedAnnexObjects(datasetId, context.userInfo))
-        },
+        files: ({ tree }) =>
+          getFiles(datasetId, tree || snapshot.hexsha).then(
+            filterRemovedAnnexObjects(datasetId, context.userInfo),
+          ),
         size: () =>
           getFiles(datasetId, snapshot.hexsha).then(response => response.size),
         deprecated: () => deprecated({ datasetId, tag }),

From 16a94f053725ac2170b8c8e4d49727c2772c0ff5 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 09:41:54 -0700
Subject: [PATCH 12/34] docs(api): Add documentation for how to retrieve file
 listings

---
 docs/api.md | 112 ++++++++++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 112 insertions(+)

diff --git a/docs/api.md b/docs/api.md
index 69fdedc886..4ab4d23368 100644
--- a/docs/api.md
+++ b/docs/api.md
@@ -92,3 +92,115 @@ mutation {
   }
 }
 ```
+
+### Obtain version file trees
+
+File trees are represented as git tree objects. There is a root tree that can be obtained by requesting the default file listing.
+
+```graphql
+query snapshotFiles {
+  snapshot(datasetId: "ds000001", tag: "1.0.0") {
+    files {
+      id
+      key
+      filename
+      size
+      directory
+      annexed
+    }
+  }
+}
+```
+
+This will return a listing of files at the top level of the dataset.
+
+```json
+{
+  "data": {
+    "snapshot": {
+      "files": [
+        {
+          "id": "92e695a42470f48ad581ac8dd0894c07ebc4a9b8",
+          "key": "87b0d1e84b52af82a50100edc269f5c24e4caba5",
+          "filename": "CHANGES",
+          "size": 273,
+          "directory": null,
+          "annexed": false
+        },
+        {
+          "id": "c1905b369e84cbb3016022ebf1ea1574087e20c2",
+          "key": "d8ced4c2adedad6d69c264f94a71df6be20a2241",
+          "filename": "README",
+          "size": 807,
+          "directory": null,
+          "annexed": false
+        },
+        {
+          "id": "7293821ae8d5c647351cb2a31484162097a442c4",
+          "key": "8f6598628c1e0938397e9a3994ba71416a674f9b",
+          "filename": "dataset_description.json",
+          "size": 150,
+          "directory": null,
+          "annexed": false
+        },
+        {
+          "id": "10834f1acb4897eaed5b29fc642718451100721b",
+          "key": null,
+          "filename": "sub-01",
+          "size": 0,
+          "directory": true,
+          "annexed": false
+        }
+      ]
+    }
+  }
+}
+```
+
+In this example, you can see that sub-01 has the `"directory": true`. This means the directory `id` field can be used to retrieve additional trees.
+
+```graphql
+query snapshotFiles {
+  snapshot(datasetId: "ds000001", tag: "1.0.0") {
+    files(tree: "10834f1acb4897eaed5b29fc642718451100721b") {
+      id
+      key
+      filename
+      size
+      directory
+      annexed
+    }
+  }
+}
+```
+
+This will return any files below sub-01 in the tree for this version.
+
+```json
+{
+  "data": {
+    "snapshot": {
+      "files": [
+        {
+          "id": "c63eeb1e0f41fea629f34269025f9d8225a2f3ff",
+          "key": null,
+          "filename": "anat",
+          "size": 0,
+          "directory": true,
+          "annexed": false
+        },
+        {
+          "id": "309cd8eae8896096c8734b024ac52be4743c9f44",
+          "key": null,
+          "filename": "func",
+          "size": 0,
+          "directory": true,
+          "annexed": false
+        }
+      ]
+    }
+  }
+}
+```
+
+The full tree can be retrieved by recursively following tree objects.

From 326dae2759322f7a6975890fe2567d3235f19cda Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 10:21:38 -0700
Subject: [PATCH 13/34] fix(worker): Sort files in a BIDS aware order

---
 services/datalad/datalad_service/common/annex.py  | 4 ++--
 services/datalad/datalad_service/common/bids.py   | 4 ++++
 services/datalad/datalad_service/handlers/tree.py | 9 ++++-----
 3 files changed, 10 insertions(+), 7 deletions(-)
 create mode 100644 services/datalad/datalad_service/common/bids.py

diff --git a/services/datalad/datalad_service/common/annex.py b/services/datalad/datalad_service/common/annex.py
index a9d71eab97..28e40ed44d 100644
--- a/services/datalad/datalad_service/common/annex.py
+++ b/services/datalad/datalad_service/common/annex.py
@@ -73,7 +73,7 @@ def read_ls_tree_line(gitTreeLine, files, symlinkFilenames, symlinkObjects):
         else:
             file_id = compute_file_hash(obj_hash, filename)
             files.append({'filename': filename, 'size': int(size),
-                          'id': file_id, 'key': obj_hash, 'urls': [], 'annexed': False})
+                          'id': file_id, 'key': obj_hash, 'directory': False, 'urls': [], 'annexed': False})
 
 
 def compute_rmet(key):
@@ -210,7 +210,7 @@ def get_repo_files(dataset_path, tree):
             filename = symlinkFilenames[(index - 1) // 2]
             file_id = compute_file_hash(key, filename)
             files.append({'filename': filename, 'size': int(
-                size), 'id': file_id, 'key': key, 'urls': [], 'annexed': True})
+                size), 'id': file_id, 'key': key, 'urls': [], 'annexed': True, 'directory': False})
     # Now find URLs for each file if available
     return get_repo_urls(dataset_path, files)
 
diff --git a/services/datalad/datalad_service/common/bids.py b/services/datalad/datalad_service/common/bids.py
new file mode 100644
index 0000000000..f1048ff221
--- /dev/null
+++ b/services/datalad/datalad_service/common/bids.py
@@ -0,0 +1,4 @@
+def dataset_sort(file):
+    """BIDS aware sorting of dataset file listings"""
+    filename = file.get('filename')
+    return (file.get('directory'), not (filename == 'dataset_description.json' or filename == 'CHANGES' or filename == 'README' or filename == 'LICENSE'), filename)
diff --git a/services/datalad/datalad_service/handlers/tree.py b/services/datalad/datalad_service/handlers/tree.py
index 6ebde33a05..08dc3ff229 100644
--- a/services/datalad/datalad_service/handlers/tree.py
+++ b/services/datalad/datalad_service/handlers/tree.py
@@ -2,6 +2,7 @@
 
 import falcon
 
+from datalad_service.common.bids import dataset_sort
 from datalad_service.tasks.files import get_tree
 
 
@@ -14,8 +15,6 @@ def on_get(self, req, resp, dataset, tree):
         # Request for index of files
         # Return a list of file objects
         # {name, path, size}
-        try:
-            files = get_tree(self.store, dataset, tree)
-            resp.media = {'files': files}
-        except:
-            resp.status = falcon.HTTP_INTERNAL_SERVER_ERROR
+        files = get_tree(self.store, dataset, tree)
+        files.sort(key=dataset_sort)
+        resp.media = {'files': files}

From 88c2f79e69b1ea2cd59d0f35018b27fd3df44f36 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 10:30:15 -0700
Subject: [PATCH 14/34] fix(app): Remove client side sort behavior and adjust
 tests for new tree APIs

---
 .../snapshot-container.spec.tsx.snap          | 84 +++++++++----------
 .../file-tree-unloaded-directory.spec.jsx     | 20 +----
 .../files/__tests__/file-tree.spec.jsx        | 26 +-----
 .../src/scripts/dataset/files/files.tsx       |  5 +-
 4 files changed, 48 insertions(+), 87 deletions(-)

diff --git a/packages/openneuro-app/src/scripts/dataset/__tests__/__snapshots__/snapshot-container.spec.tsx.snap b/packages/openneuro-app/src/scripts/dataset/__tests__/__snapshots__/snapshot-container.spec.tsx.snap
index 90c972a427..b2f142def3 100644
--- a/packages/openneuro-app/src/scripts/dataset/__tests__/__snapshots__/snapshot-container.spec.tsx.snap
+++ b/packages/openneuro-app/src/scripts/dataset/__tests__/__snapshots__/snapshot-container.spec.tsx.snap
@@ -624,13 +624,13 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                 aria-label=""
                                 class=" on-icon  "
                                 role="img"
-                                style="color: limegreen;"
+                                style="color: deepskyblue;"
                               >
                                 <i
-                                  class="fab fa-node-js"
+                                  class="fab fa-markdown"
                                 />
                               </span>
-                                dataset_description.json
+                                README
                               <span
                                 class="filetree-editfile"
                               >
@@ -647,7 +647,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   >
                                     <a
                                       aria-label="view file"
-                                      href="/datasets/ds001032/versions/1.0.0/file-display/dataset_description.json"
+                                      href="/datasets/ds001032/versions/1.0.0/file-display/README"
                                     >
                                       <i
                                         class="fa fa-eye"
@@ -664,13 +664,13 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                 aria-label=""
                                 class=" on-icon  "
                                 role="img"
-                                style="color: lightgreen;"
+                                style="color: limegreen;"
                               >
                                 <i
-                                  class="fas fa-file-excel"
+                                  class="fab fa-node-js"
                                 />
                               </span>
-                                participants.tsv
+                                T1w.json
                               <span
                                 class="filetree-editfile"
                               >
@@ -687,7 +687,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   >
                                     <a
                                       aria-label="view file"
-                                      href="/datasets/ds001032/versions/1.0.0/file-display/participants.tsv"
+                                      href="/datasets/ds001032/versions/1.0.0/file-display/T1w.json"
                                     >
                                       <i
                                         class="fa fa-eye"
@@ -704,13 +704,13 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                 aria-label=""
                                 class=" on-icon  "
                                 role="img"
-                                style="color: deepskyblue;"
+                                style="color: limegreen;"
                               >
                                 <i
-                                  class="fab fa-markdown"
+                                  class="fab fa-node-js"
                                 />
                               </span>
-                                README
+                                dataset_description.json
                               <span
                                 class="filetree-editfile"
                               >
@@ -727,7 +727,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   >
                                     <a
                                       aria-label="view file"
-                                      href="/datasets/ds001032/versions/1.0.0/file-display/README"
+                                      href="/datasets/ds001032/versions/1.0.0/file-display/dataset_description.json"
                                     >
                                       <i
                                         class="fa fa-eye"
@@ -744,13 +744,13 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                 aria-label=""
                                 class=" on-icon  "
                                 role="img"
-                                style="color: limegreen;"
+                                style="color: lightgreen;"
                               >
                                 <i
-                                  class="fab fa-node-js"
+                                  class="fas fa-file-excel"
                                 />
                               </span>
-                                T1w.json
+                                participants.tsv
                               <span
                                 class="filetree-editfile"
                               >
@@ -767,7 +767,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   >
                                     <a
                                       aria-label="view file"
-                                      href="/datasets/ds001032/versions/1.0.0/file-display/T1w.json"
+                                      href="/datasets/ds001032/versions/1.0.0/file-display/participants.tsv"
                                     >
                                       <i
                                         class="fa fa-eye"
@@ -974,13 +974,13 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                 aria-label=""
                                 class=" on-icon  "
                                 role="img"
-                                style="color: limegreen;"
+                                style="color: deepskyblue;"
                               >
                                 <i
-                                  class="fab fa-node-js"
+                                  class="fab fa-markdown"
                                 />
                               </span>
-                                dataset_description.json
+                                README
                               <span
                                 class="filetree-editfile"
                               >
@@ -990,7 +990,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   <span
                                     class=" "
                                     data-flow="up"
-                                    data-tooltip="Download: 172B"
+                                    data-tooltip="Download: 709B"
                                   >
                                     <span
                                       class="edit-file download-file"
@@ -998,7 +998,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                       <a
                                         aria-label="download file"
                                         download=""
-                                        href="/crn/datasets/ds001032/snapshots/1.0.0/files/dataset_description.json"
+                                        href="/crn/datasets/ds001032/snapshots/1.0.0/files/README"
                                       >
                                         <i
                                           class="fa fa-download"
@@ -1017,7 +1017,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   >
                                     <a
                                       aria-label="view file"
-                                      href="/datasets/ds001032/versions/1.0.0/file-display/dataset_description.json"
+                                      href="/datasets/ds001032/versions/1.0.0/file-display/README"
                                     >
                                       <i
                                         class="fa fa-eye"
@@ -1034,13 +1034,13 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                 aria-label=""
                                 class=" on-icon  "
                                 role="img"
-                                style="color: lightgreen;"
+                                style="color: limegreen;"
                               >
                                 <i
-                                  class="fas fa-file-excel"
+                                  class="fab fa-node-js"
                                 />
                               </span>
-                                participants.tsv
+                                T1w.json
                               <span
                                 class="filetree-editfile"
                               >
@@ -1050,7 +1050,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   <span
                                     class=" "
                                     data-flow="up"
-                                    data-tooltip="Download: 36B"
+                                    data-tooltip="Download: 196B"
                                   >
                                     <span
                                       class="edit-file download-file"
@@ -1058,7 +1058,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                       <a
                                         aria-label="download file"
                                         download=""
-                                        href="/crn/datasets/ds001032/snapshots/1.0.0/files/participants.tsv"
+                                        href="/crn/datasets/ds001032/snapshots/1.0.0/files/T1w.json"
                                       >
                                         <i
                                           class="fa fa-download"
@@ -1077,7 +1077,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   >
                                     <a
                                       aria-label="view file"
-                                      href="/datasets/ds001032/versions/1.0.0/file-display/participants.tsv"
+                                      href="/datasets/ds001032/versions/1.0.0/file-display/T1w.json"
                                     >
                                       <i
                                         class="fa fa-eye"
@@ -1094,13 +1094,13 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                 aria-label=""
                                 class=" on-icon  "
                                 role="img"
-                                style="color: deepskyblue;"
+                                style="color: limegreen;"
                               >
                                 <i
-                                  class="fab fa-markdown"
+                                  class="fab fa-node-js"
                                 />
                               </span>
-                                README
+                                dataset_description.json
                               <span
                                 class="filetree-editfile"
                               >
@@ -1110,7 +1110,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   <span
                                     class=" "
                                     data-flow="up"
-                                    data-tooltip="Download: 709B"
+                                    data-tooltip="Download: 172B"
                                   >
                                     <span
                                       class="edit-file download-file"
@@ -1118,7 +1118,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                       <a
                                         aria-label="download file"
                                         download=""
-                                        href="/crn/datasets/ds001032/snapshots/1.0.0/files/README"
+                                        href="/crn/datasets/ds001032/snapshots/1.0.0/files/dataset_description.json"
                                       >
                                         <i
                                           class="fa fa-download"
@@ -1137,7 +1137,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   >
                                     <a
                                       aria-label="view file"
-                                      href="/datasets/ds001032/versions/1.0.0/file-display/README"
+                                      href="/datasets/ds001032/versions/1.0.0/file-display/dataset_description.json"
                                     >
                                       <i
                                         class="fa fa-eye"
@@ -1154,13 +1154,13 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                 aria-label=""
                                 class=" on-icon  "
                                 role="img"
-                                style="color: limegreen;"
+                                style="color: lightgreen;"
                               >
                                 <i
-                                  class="fab fa-node-js"
+                                  class="fas fa-file-excel"
                                 />
                               </span>
-                                T1w.json
+                                participants.tsv
                               <span
                                 class="filetree-editfile"
                               >
@@ -1170,7 +1170,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   <span
                                     class=" "
                                     data-flow="up"
-                                    data-tooltip="Download: 196B"
+                                    data-tooltip="Download: 36B"
                                   >
                                     <span
                                       class="edit-file download-file"
@@ -1178,7 +1178,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                       <a
                                         aria-label="download file"
                                         download=""
-                                        href="/crn/datasets/ds001032/snapshots/1.0.0/files/T1w.json"
+                                        href="/crn/datasets/ds001032/snapshots/1.0.0/files/participants.tsv"
                                       >
                                         <i
                                           class="fa fa-download"
@@ -1197,7 +1197,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   >
                                     <a
                                       aria-label="view file"
-                                      href="/datasets/ds001032/versions/1.0.0/file-display/T1w.json"
+                                      href="/datasets/ds001032/versions/1.0.0/file-display/participants.tsv"
                                     >
                                       <i
                                         class="fa fa-eye"
@@ -1474,7 +1474,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
             >
               Uploaded by
             </h2>
-            Test User on 2021-12-17 - 9 months ago
+            Test User on 2021-12-17 - 10 months ago
           </div>
           <div
             class="dataset-meta-block undefined"
@@ -1484,7 +1484,7 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
             >
               Last Updated
             </h2>
-            2021-12-17 - 9 months ago
+            2021-12-17 - 10 months ago
           </div>
           <div
             class="dataset-meta-block undefined"
diff --git a/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree-unloaded-directory.spec.jsx b/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree-unloaded-directory.spec.jsx
index c2b6b45e00..080d7c5730 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree-unloaded-directory.spec.jsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree-unloaded-directory.spec.jsx
@@ -32,37 +32,25 @@ describe('FileTreeUnloadedDirectory component', () => {
       const dir = { filename: 'sub-01', directory: true }
       const a = { id: '1234', filename: 'a', directory: false }
       const b = { id: '5678', filename: 'b', directory: false }
-      const c = { id: '91011', filename: 'sub-01/c', directory: false }
+      const c = { id: '91011', filename: 'c', directory: false }
       const defaultObj = { dataset: { draft: { files: [a, b] } } }
       const updatedObj = { dataset: { draft: { files: [c] } } }
       expect(
         mergeNewFiles(dir)(defaultObj, { fetchMoreResult: updatedObj }).dataset
           .draft.files,
-      ).toEqual([a, b, c])
-    })
-    it('removes the existing directory facade when merging lists', () => {
-      const dir = { filename: 'sub-01', directory: true }
-      const a = { id: '1234', filename: 'a', directory: false }
-      const b = { id: '5678', filename: 'b', directory: false }
-      const c = { id: '91011', filename: 'sub-01/c', directory: false }
-      const defaultObj = { dataset: { draft: { files: [dir, a, b] } } }
-      const updatedObj = { dataset: { draft: { files: [c] } } }
-      expect(
-        mergeNewFiles(dir)(defaultObj, { fetchMoreResult: updatedObj }).dataset
-          .draft.files,
-      ).toEqual([a, b, c])
+      ).toEqual([a, b, { ...c, filename: 'sub-01:c' }])
     })
     it('works with snapshots', () => {
       const dir = { filename: 'sub-01', directory: true }
       const a = { id: '1234', filename: 'a', directory: false }
       const b = { id: '5678', filename: 'b', directory: false }
-      const c = { id: '91011', filename: 'sub-01/c', directory: false }
+      const c = { id: '91011', filename: 'c', directory: false }
       const defaultObj = { snapshot: { files: [dir, a, b] } }
       const updatedObj = { snapshot: { files: [c] } }
       expect(
         mergeNewFiles(dir, '1.0.0')(defaultObj, { fetchMoreResult: updatedObj })
           .snapshot.files,
-      ).toEqual([a, b, c])
+      ).toEqual([dir, a, b, { ...c, filename: 'sub-01:c' }])
     })
   })
 })
diff --git a/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree.spec.jsx b/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree.spec.jsx
index 2c42fb05c0..18a80ebe93 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree.spec.jsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree.spec.jsx
@@ -1,11 +1,7 @@
 import React from 'react'
 import { render, screen, fireEvent } from '@testing-library/react'
 import { MockedProvider } from '@apollo/client/testing'
-import FileTree, {
-  sortByFilename,
-  sortByName,
-  unescapePath,
-} from '../file-tree.jsx'
+import FileTree, { unescapePath } from '../file-tree'
 
 // official Jest workaround for mocking methods not implemented in JSDOM
 window.matchMedia =
@@ -56,26 +52,6 @@ describe('FileTree component', () => {
       'fa-folder',
     )
   })
-  describe('sortByFilename()', () => {
-    it('sorts the expected filename properties', () => {
-      expect(
-        sortByFilename(
-          { name: 'abc', filename: 'xyz' },
-          { name: 'xyz', filename: 'abc' },
-        ),
-      ).toBe(1)
-    })
-  })
-  describe('sortByName()', () => {
-    it('sorts the expected name properties', () => {
-      expect(
-        sortByName(
-          { name: 'abc', filename: 'xyz' },
-          { name: 'xyz', filename: 'abc' },
-        ),
-      ).toBe(-1)
-    })
-  })
   describe('unescapePath()', () => {
     it('does not alter an already escaped path', () => {
       expect(unescapePath('sub-01/anat')).toBe('sub-01/anat')
diff --git a/packages/openneuro-app/src/scripts/dataset/files/files.tsx b/packages/openneuro-app/src/scripts/dataset/files/files.tsx
index 6e246b512c..66592b8060 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/files.tsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/files.tsx
@@ -33,9 +33,6 @@ const DELETE_FILES = gql`
   }
 `
 
-export const sortByFilename = (a: DatasetFile, b: DatasetFile): number =>
-  a.filename.localeCompare(b.filename)
-
 interface FilesProps {
   datasetId: string
   snapshotTag: string
@@ -120,7 +117,7 @@ const Files = ({
               datasetId={datasetId}
               snapshotTag={snapshotTag}
               path={''}
-              files={[...files].sort(sortByFilename)}
+              files={files}
               name={datasetName}
               editMode={editMode}
               defaultExpanded={false}

From 67e10b353bfdd69d96bcaaf2e957c0d59cc909b8 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 10:30:48 -0700
Subject: [PATCH 15/34] test(worker): Add test for worker sorting behavior

---
 services/datalad/tests/test_bids.py | 60 +++++++++++++++++++++++++++++
 1 file changed, 60 insertions(+)
 create mode 100644 services/datalad/tests/test_bids.py

diff --git a/services/datalad/tests/test_bids.py b/services/datalad/tests/test_bids.py
new file mode 100644
index 0000000000..a0866b260e
--- /dev/null
+++ b/services/datalad/tests/test_bids.py
@@ -0,0 +1,60 @@
+from datalad_service.common.bids import dataset_sort
+
+
+def test_sort_bids_top_level():
+    files = [
+        {
+            "id": "c1905b369e84cbb3016022ebf1ea1574087e20c2",
+            "key": "d8ced4c2adedad6d69c264f94a71df6be20a2241",
+            "filename": "README",
+            "size": 807,
+            "directory": False,
+            "annexed": False
+        },
+        {
+            "id": "efe97703c81a388ae7891bf10927bea6f0849645",
+            "key": "dc191c3637b7c49465d29fa6290308c5b1429e32",
+            "filename": "participants.tsv",
+            "size": 179,
+            "directory": False,
+            "annexed": False
+        },
+        {
+            "id": "962a9c0777cb55a42524ca80d2da224b3f179502",
+            "key": "06626c52488fd36db8cafb452dbb816f85e0a408",
+            "filename": "task-rhymejudgment_bold.json",
+            "size": 63,
+            "directory": False,
+            "annexed": False
+        },
+        {
+            "id": "2cd97b8779f0d585293b9a134aa60be05e46bd52",
+            "key": None,
+            "filename": "derivatives",
+            "size": 0,
+            "directory": True,
+            "annexed": False
+        },
+        {
+            "id": "7293821ae8d5c647351cb2a31484162097a442c4",
+            "key": "8f6598628c1e0938397e9a3994ba71416a674f9b",
+            "filename": "dataset_description.json",
+            "size": 150,
+            "directory": False,
+            "annexed": False
+        },
+        {
+            "id": "92e695a42470f48ad581ac8dd0894c07ebc4a9b8",
+            "key": "87b0d1e84b52af82a50100edc269f5c24e4caba5",
+            "filename": "CHANGES",
+            "size": 273,
+            "directory": False,
+            "annexed": False
+        }
+    ]
+
+    sorted_files = sorted(files, key=dataset_sort)
+
+    assert sorted_files[0].get('filename') == 'CHANGES'
+    assert sorted_files[1].get('filename') == 'README'
+    assert sorted_files[2].get('filename') == 'dataset_description.json'

From 4bef1658c64d752a319eff3e27a6f83771f08bcb Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 11:07:37 -0700
Subject: [PATCH 16/34] fix(api): Use bids-validator size

---
 packages/openneuro-server/src/graphql/resolvers/draft.js   | 7 +++++--
 .../openneuro-server/src/graphql/resolvers/snapshots.js    | 6 +++++-
 2 files changed, 10 insertions(+), 3 deletions(-)

diff --git a/packages/openneuro-server/src/graphql/resolvers/draft.js b/packages/openneuro-server/src/graphql/resolvers/draft.js
index 6f7bd14146..dfd2b6e655 100644
--- a/packages/openneuro-server/src/graphql/resolvers/draft.js
+++ b/packages/openneuro-server/src/graphql/resolvers/draft.js
@@ -1,3 +1,4 @@
+import Summary from '../../models/summary'
 import { summary } from './summary.js'
 import { issues } from './issues.js'
 import { description } from './description.js'
@@ -16,8 +17,10 @@ const draftFiles = async (dataset, args, { userInfo }) => {
 
 const draftSize = async (dataset, args, { userInfo }) => {
   const hexsha = await getDraftRevision(dataset.id)
-  // TODO - Implement a different method for size
-  return 128
+  return Summary.findOne(
+    { datasetId: dataset.id, id: hexsha },
+    { size: 1 },
+  ).then(res => res.toObject().size)
 }
 
 /**
diff --git a/packages/openneuro-server/src/graphql/resolvers/snapshots.js b/packages/openneuro-server/src/graphql/resolvers/snapshots.js
index adca301579..6296aef80a 100644
--- a/packages/openneuro-server/src/graphql/resolvers/snapshots.js
+++ b/packages/openneuro-server/src/graphql/resolvers/snapshots.js
@@ -7,6 +7,7 @@ import { description } from './description.js'
 import { summary } from './summary.js'
 import { snapshotIssues } from './issues.js'
 import { getFiles } from '../../datalad/files.js'
+import Summary from '../../models/summary'
 import DatasetModel from '../../models/dataset'
 import { filterRemovedAnnexObjects } from '../utils/file.js'
 import DeprecatedSnapshot from '../../models/deprecatedSnapshot'
@@ -33,7 +34,10 @@ export const snapshot = (obj, { datasetId, tag }, context) => {
             filterRemovedAnnexObjects(datasetId, context.userInfo),
           ),
         size: () =>
-          getFiles(datasetId, snapshot.hexsha).then(response => response.size),
+          Summary.findOne(
+            { datasetId: datasetId, id: snapshot.hexsha },
+            { size: 1 },
+          ).then(res => res.toObject().size),
         deprecated: () => deprecated({ datasetId, tag }),
         related: () => related(datasetId),
         onBrainlife: () => onBrainlife(snapshot),

From b79eacf2e0b8fdc3e7eccc68edd35b8e9a47513b Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 11:12:01 -0700
Subject: [PATCH 17/34] fix(api): Don't return a false size on snapshot
 creation

---
 packages/openneuro-server/src/datalad/snapshots.js | 2 --
 1 file changed, 2 deletions(-)

diff --git a/packages/openneuro-server/src/datalad/snapshots.js b/packages/openneuro-server/src/datalad/snapshots.js
index 473fededa2..10a5997247 100644
--- a/packages/openneuro-server/src/datalad/snapshots.js
+++ b/packages/openneuro-server/src/datalad/snapshots.js
@@ -156,8 +156,6 @@ export const createSnapshot = async (
     )
     snapshot.created = new Date()
     snapshot.files = await getFiles(datasetId, tag)
-    // TODO - Use a different path for size
-    snapshot.size = 128
 
     await Promise.all([
       // Update the draft status in datasets collection in case any changes were made (DOI, License)

From c0419a484ac98ed36d6c955245a58b6e5cf843ec Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 12:38:16 -0700
Subject: [PATCH 18/34] fix(cli): Reverse tag listing during downloads (newest
 first)

---
 packages/openneuro-cli/src/actions.js | 1 +
 1 file changed, 1 insertion(+)

diff --git a/packages/openneuro-cli/src/actions.js b/packages/openneuro-cli/src/actions.js
index 13b5b2e577..984efe3bb5 100644
--- a/packages/openneuro-cli/src/actions.js
+++ b/packages/openneuro-cli/src/actions.js
@@ -263,6 +263,7 @@ export const download = (datasetId, destination, cmd) => {
     return getSnapshots(client)(datasetId).then(({ data }) => {
       if (data.dataset && data.dataset.snapshots) {
         const tags = data.dataset.snapshots.map(snap => snap.tag)
+        tags.reverse()
         return promptTags(tags).then(choices =>
           getDownload(
             destination,

From f3acc9ec8cbc130cd0e6773206f2f2d96a42114d Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 13:51:55 -0700
Subject: [PATCH 19/34] fix(cli): Use new download API

Adds better progress for file downloads as well.
---
 .../src/__tests__/download.spec.js            | 14 +---
 packages/openneuro-cli/src/datasets.js        | 19 ++++-
 packages/openneuro-cli/src/download.js        | 74 +++++++++++++------
 packages/openneuro-client/src/datasets.js     | 14 ++--
 4 files changed, 79 insertions(+), 42 deletions(-)

diff --git a/packages/openneuro-cli/src/__tests__/download.spec.js b/packages/openneuro-cli/src/__tests__/download.spec.js
index 98f6595e0c..b007d7ee8e 100644
--- a/packages/openneuro-cli/src/__tests__/download.spec.js
+++ b/packages/openneuro-cli/src/__tests__/download.spec.js
@@ -1,4 +1,4 @@
-import { downloadUrl, checkDestination } from '../download.js'
+import { checkDestination } from '../download.js'
 
 jest.mock('../config.js')
 
@@ -15,18 +15,6 @@ afterEach(() => {
 })
 
 describe('download.js', () => {
-  describe('downloadUrl()', () => {
-    it('returns snapshot url with tag arg', () => {
-      expect(downloadUrl('http://localhost:9876/', 'ds000001', '1.0.0')).toBe(
-        'http://localhost:9876/crn/datasets/ds000001/snapshots/1.0.0/download',
-      )
-    })
-    it('returns a draft url with no tag arg', () => {
-      expect(downloadUrl('http://localhost:9876/', 'ds000001', undefined)).toBe(
-        'http://localhost:9876/crn/datasets/ds000001/download',
-      )
-    })
-  })
   describe('checkDestination()', () => {
     it('throws an error on existing directories', () => {
       expect(() =>
diff --git a/packages/openneuro-cli/src/datasets.js b/packages/openneuro-cli/src/datasets.js
index 35028f9bd1..bba720cd7a 100644
--- a/packages/openneuro-cli/src/datasets.js
+++ b/packages/openneuro-cli/src/datasets.js
@@ -44,15 +44,31 @@ export const createDataset =
       })
   }
 
+export const downloadSnapshot = gql`
+  query downloadSnapshot($datasetId: ID!, $tag: String!, $tree: String) {
+    snapshot(datasetId: $datasetId, tag: $tag) {
+      id
+      files(tree: $tree) {
+        id
+        directory
+        filename
+        size
+        urls
+      }
+    }
+  }
+`
+
 export const downloadDataset =
   client =>
-  async ({ datasetId, tag }) => {
+  async ({ datasetId, tag, tree }) => {
     if (tag) {
       const { data } = await client.query({
         query: datasets.downloadSnapshot,
         variables: {
           datasetId,
           tag,
+          tree,
         },
       })
       return data.snapshot.files
@@ -61,6 +77,7 @@ export const downloadDataset =
         query: datasets.downloadDataset,
         variables: {
           datasetId,
+          tree,
         },
       })
       return data.dataset.draft.files
diff --git a/packages/openneuro-cli/src/download.js b/packages/openneuro-cli/src/download.js
index 4ada0984c7..86f0ece4ff 100644
--- a/packages/openneuro-cli/src/download.js
+++ b/packages/openneuro-cli/src/download.js
@@ -2,14 +2,10 @@ import 'cross-fetch/polyfill'
 import fs from 'fs'
 import path from 'path'
 import mkdirp from 'mkdirp'
-import { getToken, getUrl } from './config.js'
+import cliProgress from 'cli-progress'
+import { getToken } from './config.js'
 import { downloadDataset } from './datasets'
 
-export const downloadUrl = (baseUrl, datasetId, tag) =>
-  tag
-    ? `${baseUrl}crn/datasets/${datasetId}/snapshots/${tag}/download`
-    : `${baseUrl}crn/datasets/${datasetId}/download`
-
 export const checkDestination = destination => {
   if (fs.existsSync(destination)) {
     // Exists, check if directory
@@ -60,6 +56,7 @@ export const downloadFile = async (
   filename,
   fileUrl,
   apmTransaction,
+  downloadProgress,
 ) => {
   try {
     const fullPath = path.join(destination, filename)
@@ -76,6 +73,9 @@ export const downloadFile = async (
         // Setup end/error handler with Promise interface
         const responsePromise = new Promise((resolve, reject) => {
           stream.on('end', () => resolve())
+          stream.on('data', () => {
+            downloadProgress.update(writeStream.bytesWritten)
+          })
           stream.on('error', err => {
             if (apmTransaction) apmTransaction.captureError(err)
             reject(err)
@@ -104,30 +104,60 @@ export const getDownload = (
   tag,
   apmTransaction,
   client,
+  treePath = '',
+  tree = null,
 ) => {
-  const apmSetup = apmTransaction.startSpan('downloadDataset')
-  return downloadDataset(client)({ datasetId, tag }).then(async files => {
-    apmTransaction.addLabels({ datasetId, tag })
+  const apmSetup = apmTransaction.startSpan('getDownload')
+  return downloadDataset(client)({ datasetId, tag, tree }).then(async files => {
+    apmTransaction.addLabels({ datasetId, tag, tree })
     checkDestination(destination)
     apmSetup.end()
     for (const file of files) {
-      if (testFile(destination, file.filename, file.size)) {
-        // Now actually download
-        const apmDownload = apmTransaction.startSpan(
-          `download ${file.filename}:${file.size}`,
-        )
-        // eslint-disable-next-line no-console
-        console.log(`Downloading "${file.filename}" - size ${file.size} bytes`)
-        await downloadFile(
+      const downloadPath = path.join(treePath, file.filename)
+      if (file.directory) {
+        await getDownload(
           destination,
-          file.filename,
-          file.urls[file.urls.length - 1],
+          datasetId,
+          tag,
           apmTransaction,
+          client,
+          downloadPath,
+          file.id,
         )
-        if (apmDownload) apmDownload.end()
       } else {
-        // eslint-disable-next-line no-console
-        console.log(`Skipping present file "${file.filename}"`)
+        const downloadProgress = new cliProgress.SingleBar({
+          format:
+            ' [{bar}] {percentage}% | ETA: {eta}s | {value}/{total} | ' +
+            downloadPath,
+          clearOnComplete: false,
+          hideCursor: true,
+          position: 'center',
+          etaBuffer: 65536,
+          autopadding: true,
+        })
+        if (testFile(destination, downloadPath, file.size)) {
+          // Now actually download
+          const apmDownload = apmTransaction.startSpan(
+            `download ${downloadPath}:${file.size}`,
+          )
+          downloadProgress.start(file.size, 0)
+          try {
+            await downloadFile(
+              destination,
+              downloadPath,
+              file.urls[file.urls.length - 1],
+              apmTransaction,
+              downloadProgress,
+            )
+            downloadProgress.update(file.size)
+          } finally {
+            downloadProgress.stop()
+          }
+          if (apmDownload) apmDownload.end()
+        } else {
+          downloadProgress.start(file.size, file.size)
+          downloadProgress.stop()
+        }
       }
     }
   })
diff --git a/packages/openneuro-client/src/datasets.js b/packages/openneuro-client/src/datasets.js
index 2850f31ee3..f0de9918d9 100644
--- a/packages/openneuro-client/src/datasets.js
+++ b/packages/openneuro-client/src/datasets.js
@@ -80,12 +80,12 @@ export const getDataset = gql`
 
 // Get only working tree files
 export const getDraftFiles = gql`
-  query dataset($id: ID!) {
+  query dataset($id: ID!, $tree: String) {
     dataset(id: $id) {
       id
       draft {
         id
-        files(prefix: null) {
+        files(tree: $tree) {
           filename
           size
         }
@@ -285,13 +285,14 @@ export const trackAnalytics = gql`
 `
 
 export const downloadDataset = gql`
-  query dataset($datasetId: ID!) {
+  query downloadDraft($datasetId: ID!, $tree: String) {
     dataset(id: $datasetId) {
       id
       draft {
         id
-        files(prefix: null) {
+        files(tree: $tree) {
           id
+          directory
           filename
           size
           urls
@@ -302,11 +303,12 @@ export const downloadDataset = gql`
 `
 
 export const downloadSnapshot = gql`
-  query snapshot($datasetId: ID!, $tag: String!) {
+  query downloadSnapshot($datasetId: ID!, $tag: String!, $tree: String) {
     snapshot(datasetId: $datasetId, tag: $tag) {
       id
-      files(prefix: null) {
+      files(tree: $tree) {
         id
+        directory
         filename
         size
         urls

From 605ae7c1bb2aa58a16cdef14f37b0f91e4c32f3c Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 15:14:54 -0700
Subject: [PATCH 20/34] fix(server): Make size resolver more robust to missing
 data

---
 packages/openneuro-server/src/graphql/resolvers/draft.js   | 7 +++----
 .../openneuro-server/src/graphql/resolvers/snapshots.js    | 7 +++----
 2 files changed, 6 insertions(+), 8 deletions(-)

diff --git a/packages/openneuro-server/src/graphql/resolvers/draft.js b/packages/openneuro-server/src/graphql/resolvers/draft.js
index dfd2b6e655..20efde4a92 100644
--- a/packages/openneuro-server/src/graphql/resolvers/draft.js
+++ b/packages/openneuro-server/src/graphql/resolvers/draft.js
@@ -17,10 +17,9 @@ const draftFiles = async (dataset, args, { userInfo }) => {
 
 const draftSize = async (dataset, args, { userInfo }) => {
   const hexsha = await getDraftRevision(dataset.id)
-  return Summary.findOne(
-    { datasetId: dataset.id, id: hexsha },
-    { size: 1 },
-  ).then(res => res.toObject().size)
+  return Summary.findOne({ datasetId: dataset.id, id: hexsha })
+    .exec()
+    .then(res => res.toObject()?.size)
 }
 
 /**
diff --git a/packages/openneuro-server/src/graphql/resolvers/snapshots.js b/packages/openneuro-server/src/graphql/resolvers/snapshots.js
index 6296aef80a..4e19b68dc0 100644
--- a/packages/openneuro-server/src/graphql/resolvers/snapshots.js
+++ b/packages/openneuro-server/src/graphql/resolvers/snapshots.js
@@ -34,10 +34,9 @@ export const snapshot = (obj, { datasetId, tag }, context) => {
             filterRemovedAnnexObjects(datasetId, context.userInfo),
           ),
         size: () =>
-          Summary.findOne(
-            { datasetId: datasetId, id: snapshot.hexsha },
-            { size: 1 },
-          ).then(res => res.toObject().size),
+          Summary.findOne({ datasetId: datasetId, id: snapshot.hexsha })
+            .exec()
+            .then(res => res.toObject()?.size),
         deprecated: () => deprecated({ datasetId, tag }),
         related: () => related(datasetId),
         onBrainlife: () => onBrainlife(snapshot),

From 2413bef31bab0765c7845c22c5b37159b8df157f Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 15:15:22 -0700
Subject: [PATCH 21/34] fix(cli): Cleanup unused GraphQL query

---
 packages/openneuro-cli/src/datasets.js | 15 ---------------
 1 file changed, 15 deletions(-)

diff --git a/packages/openneuro-cli/src/datasets.js b/packages/openneuro-cli/src/datasets.js
index bba720cd7a..78b52b671c 100644
--- a/packages/openneuro-cli/src/datasets.js
+++ b/packages/openneuro-cli/src/datasets.js
@@ -44,21 +44,6 @@ export const createDataset =
       })
   }
 
-export const downloadSnapshot = gql`
-  query downloadSnapshot($datasetId: ID!, $tag: String!, $tree: String) {
-    snapshot(datasetId: $datasetId, tag: $tag) {
-      id
-      files(tree: $tree) {
-        id
-        directory
-        filename
-        size
-        urls
-      }
-    }
-  }
-`
-
 export const downloadDataset =
   client =>
   async ({ datasetId, tag, tree }) => {

From 65bb34249a8788a8a46dad2eba80319c9cd63c2f Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 15:15:46 -0700
Subject: [PATCH 22/34] fix(app): Fix APM init issue that prevents local
 testing of downloads

---
 packages/openneuro-app/src/scripts/apm.js | 2 --
 1 file changed, 2 deletions(-)

diff --git a/packages/openneuro-app/src/scripts/apm.js b/packages/openneuro-app/src/scripts/apm.js
index e6a76e7728..46b55a603e 100644
--- a/packages/openneuro-app/src/scripts/apm.js
+++ b/packages/openneuro-app/src/scripts/apm.js
@@ -15,8 +15,6 @@ export function setupApm() {
       serviceVersion: version,
       environment: config.sentry.environment,
     })
-  } else {
-    apm = {}
   }
 }
 

From a18a337c19233c667d064e15216ae6451bdd856a Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 15:16:26 -0700
Subject: [PATCH 23/34] refactor(app): Use new file trees during browser
 download

---
 .../dataset/download/download-native.js       | 96 +++++++++++++------
 .../dataset/download/download-query.js        |  4 +-
 2 files changed, 68 insertions(+), 32 deletions(-)

diff --git a/packages/openneuro-app/src/scripts/dataset/download/download-native.js b/packages/openneuro-app/src/scripts/dataset/download/download-native.js
index a1746fa208..52cf9dfce0 100644
--- a/packages/openneuro-app/src/scripts/dataset/download/download-native.js
+++ b/packages/openneuro-app/src/scripts/dataset/download/download-native.js
@@ -40,30 +40,77 @@ class DownloadAbortError extends Error {
   }
 }
 
+let downloadCanceled
+
+const downloadTree = async (
+  datasetId,
+  snapshotTag,
+  client,
+  apmTransaction,
+  dirHandle,
+  toastId,
+  path = '',
+  tree = null,
+) => {
+  const filesToDownload = await downloadDataset(client)({
+    datasetId,
+    snapshotTag,
+    tree,
+  })
+  for (const [index, file] of filesToDownload.entries()) {
+    if (file.directory) {
+      // Next tree level
+      await downloadTree(
+        datasetId,
+        snapshotTag,
+        client,
+        apmTransaction,
+        dirHandle,
+        toastId,
+        path ? `${path}/${file.filename}` : file.filename,
+        file.id,
+      )
+    } else {
+      // Regular file
+      if (downloadCanceled) {
+        throw new DownloadAbortError('Download canceled by user request')
+      }
+      const fileHandle = await openFileTree(
+        dirHandle,
+        path ? `${path}/${file.filename}` : file.filename,
+      )
+      // Skip files which are already complete
+      if (fileHandle.size == file.size) continue
+      const writable = await fileHandle.createWritable()
+      const { body, status, statusText } = await fetch(file.urls.pop())
+      if (status === 200) {
+        await body.pipeTo(writable)
+      } else {
+        apmTransaction.captureError(statusText)
+        return requestFailureToast()
+      }
+      downloadToastUpdate(toastId, index / filesToDownload.length)
+    }
+  }
+}
+
 /**
  * Downloads a dataset via the native file API, skipping expensive compression if the browser supports it
  * @param {string} datasetId Accession number string for a dataset
  * @param {string} snapshotTag Snapshot tag name
  */
 export const downloadNative = (datasetId, snapshotTag, client) => async () => {
-  const filesToDownload = await downloadDataset(client)({
-    datasetId,
-    snapshotTag,
-  })
-
   // Try trackDownload but don't worry if it fails
   try {
     trackDownload(client, datasetId, snapshotTag)
   } catch (err) {
     apm.captureError(err)
   }
-  const apmTransaction = apm.startTransaction(
-    `download:${datasetId}`,
-    'download',
-  )
+  const apmTransaction =
+    apm && apm.startTransaction(`download:${datasetId}`, 'download')
   if (apmTransaction)
     apmTransaction.addLabels({ datasetId, snapshot: snapshotTag })
-  let downloadCanceled = false
+  downloadCanceled = false
   let toastId
   try {
     const apmSelect =
@@ -77,27 +124,14 @@ export const downloadNative = (datasetId, snapshotTag, client) => async () => {
       () => (downloadCanceled = true),
     )
     apmSelect && apmSelect.end()
-    for (const [index, file] of filesToDownload.entries()) {
-      const apmDownload =
-        apmTransaction &&
-        apmTransaction.startSpan(`download ${file.filename}:${file.size}`)
-      if (downloadCanceled) {
-        throw new DownloadAbortError('Download canceled by user request')
-      }
-      const fileHandle = await openFileTree(dirHandle, file.filename)
-      // Skip files which are already complete
-      if (fileHandle.size == file.size) continue
-      const writable = await fileHandle.createWritable()
-      const { body, status, statusText } = await fetch(file.urls.pop())
-      if (status === 200) {
-        await body.pipeTo(writable)
-      } else {
-        apmDownload && apmDownload.captureError(statusText)
-        return requestFailureToast()
-      }
-      apmDownload && apmDownload.end()
-      downloadToastUpdate(toastId, index / filesToDownload.length)
-    }
+    await downloadTree(
+      datasetId,
+      snapshotTag,
+      client,
+      apmTransaction,
+      dirHandle,
+      toastId,
+    )
     downloadCompleteToast(dirHandle.name)
   } catch (err) {
     if (err.name === 'AbortError') {
diff --git a/packages/openneuro-app/src/scripts/dataset/download/download-query.js b/packages/openneuro-app/src/scripts/dataset/download/download-query.js
index 054d436e5b..72a29a460f 100644
--- a/packages/openneuro-app/src/scripts/dataset/download/download-query.js
+++ b/packages/openneuro-app/src/scripts/dataset/download/download-query.js
@@ -2,13 +2,14 @@ import { datasets } from '@openneuro/client'
 
 export const downloadDataset =
   client =>
-  async ({ datasetId, snapshotTag }) => {
+  async ({ datasetId, snapshotTag, tree = null }) => {
     if (snapshotTag) {
       const { data } = await client.query({
         query: datasets.downloadSnapshot,
         variables: {
           datasetId,
           tag: snapshotTag,
+          tree: tree,
         },
       })
       return data.snapshot.files
@@ -17,6 +18,7 @@ export const downloadDataset =
         query: datasets.downloadDataset,
         variables: {
           datasetId,
+          tree,
         },
       })
       return data.dataset.draft.files

From 1bdfd8084674f80b3cde7b505f2cd20e91af17db Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 15:42:22 -0700
Subject: [PATCH 24/34] fix(app): Improve progress handling for native browser
 downloads

---
 .../dataset/download/download-native.js       | 47 ++++++++++++-------
 .../dataset/download/native-file-toast.jsx    | 23 +++++++--
 2 files changed, 49 insertions(+), 21 deletions(-)

diff --git a/packages/openneuro-app/src/scripts/dataset/download/download-native.js b/packages/openneuro-app/src/scripts/dataset/download/download-native.js
index 52cf9dfce0..c026771541 100644
--- a/packages/openneuro-app/src/scripts/dataset/download/download-native.js
+++ b/packages/openneuro-app/src/scripts/dataset/download/download-native.js
@@ -42,13 +42,11 @@ class DownloadAbortError extends Error {
 
 let downloadCanceled
 
+/**
+ * Recursive download for file trees via browser file access API
+ */
 const downloadTree = async (
-  datasetId,
-  snapshotTag,
-  client,
-  apmTransaction,
-  dirHandle,
-  toastId,
+  { datasetId, snapshotTag, client, apmTransaction, dirHandle, toastId },
   path = '',
   tree = null,
 ) => {
@@ -58,16 +56,19 @@ const downloadTree = async (
     tree,
   })
   for (const [index, file] of filesToDownload.entries()) {
+    const downloadPath = path ? `${path}/${file.filename}` : file.filename
     if (file.directory) {
       // Next tree level
       await downloadTree(
-        datasetId,
-        snapshotTag,
-        client,
-        apmTransaction,
-        dirHandle,
-        toastId,
-        path ? `${path}/${file.filename}` : file.filename,
+        {
+          datasetId,
+          snapshotTag,
+          client,
+          apmTransaction,
+          dirHandle,
+          toastId,
+        },
+        downloadPath,
         file.id,
       )
     } else {
@@ -83,13 +84,25 @@ const downloadTree = async (
       if (fileHandle.size == file.size) continue
       const writable = await fileHandle.createWritable()
       const { body, status, statusText } = await fetch(file.urls.pop())
+      let loaded = 0
+      const progress = new TransformStream({
+        transform(chunk, controller) {
+          downloadToastUpdate(toastId, loaded / file.size, {
+            datasetId,
+            snapshotTag,
+            downloadPath,
+            dirName: dirHandle.name,
+          })
+          loaded += chunk.length
+          controller.enqueue(chunk)
+        },
+      })
       if (status === 200) {
-        await body.pipeTo(writable)
+        await body.pipeThrough(progress).pipeTo(writable)
       } else {
         apmTransaction.captureError(statusText)
         return requestFailureToast()
       }
-      downloadToastUpdate(toastId, index / filesToDownload.length)
     }
   }
 }
@@ -124,14 +137,14 @@ export const downloadNative = (datasetId, snapshotTag, client) => async () => {
       () => (downloadCanceled = true),
     )
     apmSelect && apmSelect.end()
-    await downloadTree(
+    await downloadTree({
       datasetId,
       snapshotTag,
       client,
       apmTransaction,
       dirHandle,
       toastId,
-    )
+    })
     downloadCompleteToast(dirHandle.name)
   } catch (err) {
     if (err.name === 'AbortError') {
diff --git a/packages/openneuro-app/src/scripts/dataset/download/native-file-toast.jsx b/packages/openneuro-app/src/scripts/dataset/download/native-file-toast.jsx
index b145a8ad5f..4d434cfbac 100644
--- a/packages/openneuro-app/src/scripts/dataset/download/native-file-toast.jsx
+++ b/packages/openneuro-app/src/scripts/dataset/download/native-file-toast.jsx
@@ -70,8 +70,8 @@ export const downloadCompleteToast = dirName => {
  */
 export const downloadToast = (dirName, datasetId, snapshotId, onClose) => {
   const downloadMessage = snapshotId
-    ? `Copying ${datasetId} snapshot ${snapshotId} to local folder ${dirName}`
-    : `Copying ${datasetId} to local folder ${dirName}`
+    ? `${datasetId} snapshot ${snapshotId} to local folder ${dirName}`
+    : `${datasetId} to local folder ${dirName}`
   return toast(
     <ToastContent title={'Downloading'} body={downloadMessage}></ToastContent>,
     {
@@ -84,7 +84,22 @@ export const downloadToast = (dirName, datasetId, snapshotId, onClose) => {
   )
 }
 
-export const downloadToastUpdate = (toastId, progress) =>
-  toast.update(toastId, { progress })
+export const downloadToastUpdate = (
+  toastId,
+  progress,
+  { datasetId, snapshotTag, downloadPath, dirName },
+) => {
+  const downloadMessage = snapshotTag
+    ? `${datasetId} snapshot ${snapshotTag} to local folder ${dirName}`
+    : `${datasetId} to local folder ${dirName}`
+  toast.update(toastId, {
+    render: (
+      <ToastContent title={'Downloading'} body={downloadMessage}>
+        {downloadPath}
+      </ToastContent>
+    ),
+    progress,
+  })
+}
 
 export const downloadToastDone = toastId => toast.done(toastId)

From 93598ab0bf8c9e0fe41d99a2fe1ca824cddad71f Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 20:37:13 -0700
Subject: [PATCH 25/34] fix(api): Remove unused cache clear from draft files

---
 packages/openneuro-server/src/datalad/dataset.js |  3 +--
 packages/openneuro-server/src/datalad/draft.js   | 11 -----------
 2 files changed, 1 insertion(+), 13 deletions(-)

diff --git a/packages/openneuro-server/src/datalad/dataset.js b/packages/openneuro-server/src/datalad/dataset.js
index 19b8dfcce1..328edfb01f 100644
--- a/packages/openneuro-server/src/datalad/dataset.js
+++ b/packages/openneuro-server/src/datalad/dataset.js
@@ -12,7 +12,7 @@ import * as subscriptions from '../handlers/subscriptions.js'
 import { generateDataladCookie } from '../libs/authentication/jwt'
 import { redis } from '../libs/redis'
 import CacheItem, { CacheType } from '../cache/item'
-import { updateDatasetRevision, expireDraftFiles } from './draft.js'
+import { updateDatasetRevision } from './draft.js'
 import { fileUrl, getFileName, encodeFilePath, filesUrl } from './files'
 import { getAccessionNumber } from '../libs/dataset.js'
 import Dataset from '../models/dataset'
@@ -309,7 +309,6 @@ export const testBlacklist = (path, filename) =>
 export const addFile = async (datasetId, path, file) => {
   try {
     const { filename, mimetype, createReadStream, capacitor } = await file
-    await expireDraftFiles(datasetId)
 
     // Apply blacklist to uploaded files
     if (testBlacklist(path, filename)) {
diff --git a/packages/openneuro-server/src/datalad/draft.js b/packages/openneuro-server/src/datalad/draft.js
index 6fcd6683de..7d23c32a8a 100644
--- a/packages/openneuro-server/src/datalad/draft.js
+++ b/packages/openneuro-server/src/datalad/draft.js
@@ -4,16 +4,9 @@
 import fetch from 'node-fetch'
 import request from 'superagent'
 import Dataset from '../models/dataset'
-import { redis } from '../libs/redis'
-import CacheItem, { CacheType } from '../cache/item'
 import publishDraftUpdate from '../graphql/utils/publish-draft-update.js'
 import { getDatasetWorker } from '../libs/datalad-service'
 
-export const expireDraftFiles = datasetId => {
-  const cache = new CacheItem(redis, CacheType.commitFiles, [datasetId])
-  return cache.drop()
-}
-
 export const getDraftRevision = async datasetId => {
   const draftUrl = `http://${getDatasetWorker(
     datasetId,
@@ -29,10 +22,6 @@ export const updateDatasetRevision = (datasetId, gitRef) => {
    */
   return Dataset.updateOne({ id: datasetId }, { modified: new Date() })
     .exec()
-    .then(() => {
-      // Remove the now invalid draft files cache
-      return expireDraftFiles(datasetId)
-    })
     .then(() => publishDraftUpdate(datasetId, gitRef))
 }
 

From 5f11372b8458c34094e516f28ab46109d287ccd5 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Mon, 3 Oct 2022 20:43:17 -0700
Subject: [PATCH 26/34] tests(worker): Set explicit 'directory': False values
 on non-annexed files

---
 services/datalad/tests/test_annex.py     |  5 +++--
 services/datalad/tests/test_files.py     | 10 +++++-----
 services/datalad/tests/test_snapshots.py |  4 ++--
 3 files changed, 10 insertions(+), 9 deletions(-)

diff --git a/services/datalad/tests/test_annex.py b/services/datalad/tests/test_annex.py
index 68fde689c7..c369b5b967 100644
--- a/services/datalad/tests/test_annex.py
+++ b/services/datalad/tests/test_annex.py
@@ -42,7 +42,8 @@ def test_get_ls_tree_line():
             'id': '78dd92373749f62af23f3ae499b7a8ac33418fff',
             'key': 'a786c385bd1812410d01177affb6ce834d85facd',
             'urls': [],
-            'annexed': False}]
+            'annexed': False,
+            'directory': False}]
     assert symlinkFilenames == []
     assert symlinkObjects == []
 
@@ -135,4 +136,4 @@ def test_remote_url_encoding():
         "https://s3.amazonaws.com/openneuro.org/ds000248/derivatives/freesurfer/subjects/sub-01/mri/aparc+aseg.mgz?versionId=2Wx7w.fCYeGzGWLnW9sxWsPdztl.2HL0") == "https://s3.amazonaws.com/openneuro.org/ds000248/derivatives/freesurfer/subjects/sub-01/mri/aparc%2Baseg.mgz?versionId=2Wx7w.fCYeGzGWLnW9sxWsPdztl.2HL0"
     assert encode_remote_url(
         "https://s3.amazonaws.com/openneuro.org/ds000248/sub-01/anat/sub-01_T1w.nii.gz?versionId=8uTXIQ10Blcp2GeAVJJCHL5PimkSaQZL") == "https://s3.amazonaws.com/openneuro.org/ds000248/sub-01/anat/sub-01_T1w.nii.gz?versionId=8uTXIQ10Blcp2GeAVJJCHL5PimkSaQZL"
-    assert encode_remote_url("=") == '='
\ No newline at end of file
+    assert encode_remote_url("=") == '='
diff --git a/services/datalad/tests/test_files.py b/services/datalad/tests/test_files.py
index 3823287934..17ecb3e6a5 100644
--- a/services/datalad/tests/test_files.py
+++ b/services/datalad/tests/test_files.py
@@ -129,11 +129,11 @@ def test_file_indexing(client, new_dataset):
         {'filename': 'dataset_description.json', 'size': 101,
             'id': '43502da40903d08b18b533f8897330badd6e1da3',
             'key': '838d19644b3296cf32637bbdf9ae5c87db34842f',
-            'urls': [], 'annexed': False},
+            'urls': [], 'annexed': False, 'directory': False},
         {'filename': 'LICENSE', 'size': 8,
             'id': '8a6f5281317d8a8fb695d12c940b0ff7a7dee435',
             'key': 'MD5E-s8--4d87586dfb83dc4a5d15c6cfa6f61e27',
-            'urls': [], 'annexed': True},
+            'urls': [], 'annexed': True, 'directory': False},
         {'id': '2f8451ae1016f936999aaacc0b3d79fb284ac3ea', 'filename': 'sub-01',
             'directory': True, 'annexed': False, 'size': 0, 'urls': []}
     ]:
@@ -154,7 +154,7 @@ def test_file_indexing(client, new_dataset):
     assert {'filename': 'sub-01_T1w.nii.gz', 'size': 19,
             'id': 'e497096a2bce0d48b2761dade2b5c4e5a0f352bd',
             'key': 'MD5E-s19--8149926e49b677a5ccecf1ad565acccf.nii.gz',
-            'urls': [], 'annexed': True} in anat_content['files']
+            'urls': [], 'annexed': True, 'directory': False} in anat_content['files']
 
 
 def test_empty_file(client, new_dataset):
@@ -175,10 +175,10 @@ def test_empty_file(client, new_dataset):
     # Check that all elements exist in both lists
     assert({'filename': 'LICENSE',
             'size': 0, 'id': '5bfdc52581371bfa051fa76825a0e1b5e5c3b4bf',
-            'key': 'MD5E-s0--d41d8cd98f00b204e9800998ecf8427e', 'urls': [], 'annexed': True} in response_content['files'])
+            'key': 'MD5E-s0--d41d8cd98f00b204e9800998ecf8427e', 'urls': [], 'annexed': True, 'directory': False} in response_content['files'])
     assert({'filename': 'dataset_description.json',
             'size': 101, 'id': '43502da40903d08b18b533f8897330badd6e1da3',
-            'key': '838d19644b3296cf32637bbdf9ae5c87db34842f', 'urls': [], 'annexed': False} in response_content['files'])
+            'key': '838d19644b3296cf32637bbdf9ae5c87db34842f', 'urls': [], 'annexed': False, 'directory': False} in response_content['files'])
 
 
 def test_duplicate_file_id(client, new_dataset):
diff --git a/services/datalad/tests/test_snapshots.py b/services/datalad/tests/test_snapshots.py
index e767e99d4c..ec38325035 100644
--- a/services/datalad/tests/test_snapshots.py
+++ b/services/datalad/tests/test_snapshots.py
@@ -20,10 +20,10 @@ def test_get_snapshot(client):
     assert result_doc['files'] == [
         {'filename': 'CHANGES', 'size': 41, 'id': '0daaa69260ab1f1fa8cfd0e17a4c1993d6d46e54',
          'key': '63f4f8294caf64dccfedcb5300dee70e3fe3a7c5', 'urls': [],
-         'annexed': False},
+         'annexed': False, 'directory': False},
         {'filename': 'dataset_description.json', 'size': 97, 'id': '9c946a75b4c24c14e65d746b2ff295a904845aa3',
          'key': '85b9ddf2bfaf1d9300d612dc29774a98cc1d5e25', 'urls': [],
-         'annexed': False}
+         'annexed': False, 'directory': False}
     ]
     assert result_doc['tag'] == SNAPSHOT_ID
     assert result_doc['id'] == '{}:{}'.format(DATASET_ID, SNAPSHOT_ID)

From c51a3d021c8b691ead861f1b3ca379343091e279 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Tue, 4 Oct 2022 09:05:33 -0700
Subject: [PATCH 27/34] docs(api): Update examples for file listings

---
 docs/api.md | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/docs/api.md b/docs/api.md
index 4ab4d23368..69cc6af7c7 100644
--- a/docs/api.md
+++ b/docs/api.md
@@ -93,9 +93,9 @@ mutation {
 }
 ```
 
-### Obtain version file trees
+### Obtain dataset file trees
 
-File trees are represented as git tree objects. There is a root tree that can be obtained by requesting the default file listing.
+File trees are represented as git tree objects. There is a root tree for each version (commit or tag) that can be obtained by requesting the default file listing.
 
 ```graphql
 query snapshotFiles {
@@ -124,7 +124,7 @@ This will return a listing of files at the top level of the dataset.
           "key": "87b0d1e84b52af82a50100edc269f5c24e4caba5",
           "filename": "CHANGES",
           "size": 273,
-          "directory": null,
+          "directory": false,
           "annexed": false
         },
         {
@@ -132,7 +132,7 @@ This will return a listing of files at the top level of the dataset.
           "key": "d8ced4c2adedad6d69c264f94a71df6be20a2241",
           "filename": "README",
           "size": 807,
-          "directory": null,
+          "directory": false,
           "annexed": false
         },
         {
@@ -140,7 +140,7 @@ This will return a listing of files at the top level of the dataset.
           "key": "8f6598628c1e0938397e9a3994ba71416a674f9b",
           "filename": "dataset_description.json",
           "size": 150,
-          "directory": null,
+          "directory": false,
           "annexed": false
         },
         {

From 460dfc3702097254751d249e562417c30f26a81c Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Tue, 4 Oct 2022 09:59:07 -0700
Subject: [PATCH 28/34] fix(api): Return null size earlier for size resolvers

---
 packages/openneuro-server/src/graphql/resolvers/draft.js     | 2 +-
 packages/openneuro-server/src/graphql/resolvers/snapshots.js | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/packages/openneuro-server/src/graphql/resolvers/draft.js b/packages/openneuro-server/src/graphql/resolvers/draft.js
index 20efde4a92..9ad4e5b7d0 100644
--- a/packages/openneuro-server/src/graphql/resolvers/draft.js
+++ b/packages/openneuro-server/src/graphql/resolvers/draft.js
@@ -19,7 +19,7 @@ const draftSize = async (dataset, args, { userInfo }) => {
   const hexsha = await getDraftRevision(dataset.id)
   return Summary.findOne({ datasetId: dataset.id, id: hexsha })
     .exec()
-    .then(res => res.toObject()?.size)
+    .then(res => res?.toObject()?.size)
 }
 
 /**
diff --git a/packages/openneuro-server/src/graphql/resolvers/snapshots.js b/packages/openneuro-server/src/graphql/resolvers/snapshots.js
index 4e19b68dc0..8c46f193b7 100644
--- a/packages/openneuro-server/src/graphql/resolvers/snapshots.js
+++ b/packages/openneuro-server/src/graphql/resolvers/snapshots.js
@@ -36,7 +36,7 @@ export const snapshot = (obj, { datasetId, tag }, context) => {
         size: () =>
           Summary.findOne({ datasetId: datasetId, id: snapshot.hexsha })
             .exec()
-            .then(res => res.toObject()?.size),
+            .then(res => res?.toObject()?.size),
         deprecated: () => deprecated({ datasetId, tag }),
         related: () => related(datasetId),
         onBrainlife: () => onBrainlife(snapshot),

From 69816248878551c40892d3c8bc56306410c2bd0b Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Tue, 4 Oct 2022 10:03:36 -0700
Subject: [PATCH 29/34] fix(app): Improve loading state for file tree
 directories

Drop react-spring which was effectively commented out post-redesign.
---
 .pnp.cjs                                      | 29 ---------
 packages/openneuro-app/package.json           |  1 -
 .../snapshot-container.spec.tsx.snap          | 36 +++-------
 .../__tests__/file-tree-loading.spec.jsx      | 18 -----
 .../files/__tests__/file-tree.spec.jsx        | 10 ---
 .../dataset/files/file-tree-loading.jsx       | 65 -------------------
 .../files/file-tree-unloaded-directory.jsx    | 13 +---
 yarn.lock                                     | 16 +----
 8 files changed, 10 insertions(+), 178 deletions(-)
 delete mode 100644 packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree-loading.spec.jsx
 delete mode 100644 packages/openneuro-app/src/scripts/dataset/files/file-tree-loading.jsx

diff --git a/.pnp.cjs b/.pnp.cjs
index 4125b8bb79..15fa82ae44 100755
--- a/.pnp.cjs
+++ b/.pnp.cjs
@@ -8392,7 +8392,6 @@ function $$SETUP_STATE(hydrateRuntimeState, basePath) {
             ["react-dom", "virtual:bb4ed02b339ed801b02d2ec15b42a5aa7b1afdaf44119aefaab128a59d6e16cc6018880c169f24bf2107550e914562ee9e1780db01a12e1bc3c492ad0a049c36#npm:17.0.2"],\
             ["react-helmet", "virtual:4112afb9dad10978c159910bf10db9840b981b1333117623c8a4a8cf77481344a0a24735a5506e2920c18e3cfa2cc179489824b6a56c988bb070f4f60da40974#npm:6.1.0"],\
             ["react-router-dom", "virtual:4112afb9dad10978c159910bf10db9840b981b1333117623c8a4a8cf77481344a0a24735a5506e2920c18e3cfa2cc179489824b6a56c988bb070f4f60da40974#npm:6.3.0"],\
-            ["react-spring", "virtual:4112afb9dad10978c159910bf10db9840b981b1333117623c8a4a8cf77481344a0a24735a5506e2920c18e3cfa2cc179489824b6a56c988bb070f4f60da40974#npm:8.0.27"],\
             ["react-toastify", "virtual:4112afb9dad10978c159910bf10db9840b981b1333117623c8a4a8cf77481344a0a24735a5506e2920c18e3cfa2cc179489824b6a56c988bb070f4f60da40974#npm:6.0.9"],\
             ["react-usestateref", "virtual:bb4ed02b339ed801b02d2ec15b42a5aa7b1afdaf44119aefaab128a59d6e16cc6018880c169f24bf2107550e914562ee9e1780db01a12e1bc3c492ad0a049c36#npm:1.0.5"],\
             ["react-virtualized", "virtual:4112afb9dad10978c159910bf10db9840b981b1333117623c8a4a8cf77481344a0a24735a5506e2920c18e3cfa2cc179489824b6a56c988bb070f4f60da40974#https://github.com/remorses/react-virtualized-fixed-import.git#commit=6e416ee8aa6ac2087cecc68f68371d8fe561d9a4"],\
@@ -24879,34 +24878,6 @@ function $$SETUP_STATE(hydrateRuntimeState, basePath) {
           "linkType": "HARD"\
         }]\
       ]],\
-      ["react-spring", [\
-        ["npm:8.0.27", {\
-          "packageLocation": "./.yarn/cache/react-spring-npm-8.0.27-e2e99c79a8-4f306e30c3.zip/node_modules/react-spring/",\
-          "packageDependencies": [\
-            ["react-spring", "npm:8.0.27"]\
-          ],\
-          "linkType": "SOFT"\
-        }],\
-        ["virtual:4112afb9dad10978c159910bf10db9840b981b1333117623c8a4a8cf77481344a0a24735a5506e2920c18e3cfa2cc179489824b6a56c988bb070f4f60da40974#npm:8.0.27", {\
-          "packageLocation": "./.yarn/__virtual__/react-spring-virtual-641a2f11d7/0/cache/react-spring-npm-8.0.27-e2e99c79a8-4f306e30c3.zip/node_modules/react-spring/",\
-          "packageDependencies": [\
-            ["react-spring", "virtual:4112afb9dad10978c159910bf10db9840b981b1333117623c8a4a8cf77481344a0a24735a5506e2920c18e3cfa2cc179489824b6a56c988bb070f4f60da40974#npm:8.0.27"],\
-            ["@babel/runtime", "npm:7.15.4"],\
-            ["@types/react", "npm:17.0.24"],\
-            ["@types/react-dom", "npm:17.0.9"],\
-            ["prop-types", "npm:15.7.2"],\
-            ["react", "npm:17.0.2"],\
-            ["react-dom", "virtual:bb4ed02b339ed801b02d2ec15b42a5aa7b1afdaf44119aefaab128a59d6e16cc6018880c169f24bf2107550e914562ee9e1780db01a12e1bc3c492ad0a049c36#npm:17.0.2"]\
-          ],\
-          "packagePeers": [\
-            "@types/react-dom",\
-            "@types/react",\
-            "react-dom",\
-            "react"\
-          ],\
-          "linkType": "HARD"\
-        }]\
-      ]],\
       ["react-toastify", [\
         ["npm:6.0.9", {\
           "packageLocation": "./.yarn/cache/react-toastify-npm-6.0.9-ba911f8954-f5efca148f.zip/node_modules/react-toastify/",\
diff --git a/packages/openneuro-app/package.json b/packages/openneuro-app/package.json
index aac6e9b6b8..9e11f2efa8 100644
--- a/packages/openneuro-app/package.json
+++ b/packages/openneuro-app/package.json
@@ -39,7 +39,6 @@
     "react-dom": "^17.0.1",
     "react-helmet": "6.1.0",
     "react-router-dom": "6.3.0",
-    "react-spring": "^8.0.27",
     "react-toastify": "6.0.9",
     "react-usestateref": "^1.0.5",
     "react-virtualized": "remorses/react-virtualized-fixed-import.git#9.22.3",
diff --git a/packages/openneuro-app/src/scripts/dataset/__tests__/__snapshots__/snapshot-container.spec.tsx.snap b/packages/openneuro-app/src/scripts/dataset/__tests__/__snapshots__/snapshot-container.spec.tsx.snap
index b2f142def3..62f0a54cdb 100644
--- a/packages/openneuro-app/src/scripts/dataset/__tests__/__snapshots__/snapshot-container.spec.tsx.snap
+++ b/packages/openneuro-app/src/scripts/dataset/__tests__/__snapshots__/snapshot-container.spec.tsx.snap
@@ -803,13 +803,8 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   <div
                                     class="accordion-content"
                                   >
-                                    <div
-                                      class="css-t3f89n"
-                                    >
-                                      <div
-                                        class="css-b1x83q"
-                                        style="width: 0%;"
-                                      />
+                                    <div>
+                                      Loading...
                                     </div>
                                   </div>
                                 </div>
@@ -841,13 +836,8 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   <div
                                     class="accordion-content"
                                   >
-                                    <div
-                                      class="css-t3f89n"
-                                    >
-                                      <div
-                                        class="css-b1x83q"
-                                        style="width: 0%;"
-                                      />
+                                    <div>
+                                      Loading...
                                     </div>
                                   </div>
                                 </div>
@@ -1233,13 +1223,8 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   <div
                                     class="accordion-content"
                                   >
-                                    <div
-                                      class="css-t3f89n"
-                                    >
-                                      <div
-                                        class="css-b1x83q"
-                                        style="width: 0%;"
-                                      />
+                                    <div>
+                                      Loading...
                                     </div>
                                   </div>
                                 </div>
@@ -1271,13 +1256,8 @@ OCI-1131441 (R. Poldrack, PI) in any publications.
                                   <div
                                     class="accordion-content"
                                   >
-                                    <div
-                                      class="css-t3f89n"
-                                    >
-                                      <div
-                                        class="css-b1x83q"
-                                        style="width: 0%;"
-                                      />
+                                    <div>
+                                      Loading...
                                     </div>
                                   </div>
                                 </div>
diff --git a/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree-loading.spec.jsx b/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree-loading.spec.jsx
deleted file mode 100644
index dd1795df83..0000000000
--- a/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree-loading.spec.jsx
+++ /dev/null
@@ -1,18 +0,0 @@
-import { estimateDuration } from '../file-tree-loading.jsx'
-
-describe('FileTreeLoading component', () => {
-  describe('estimateDuration()', () => {
-    it('returns an estimate if navigator has a downlink set', () => {
-      const mockNavigator = {
-        connection: {
-          downlink: 20,
-        },
-      }
-      expect(estimateDuration(mockNavigator)(250)).toEqual(1270.703125)
-    })
-    it('returns an estimate if navigator does not have a downlink', () => {
-      const mockNavigator = {}
-      expect(estimateDuration(mockNavigator)(250)).toEqual(2491.40625)
-    })
-  })
-})
diff --git a/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree.spec.jsx b/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree.spec.jsx
index 18a80ebe93..d90de6744a 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree.spec.jsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree.spec.jsx
@@ -14,16 +14,6 @@ window.matchMedia =
     }
   }
 
-/* eslint-disable */
-jest.mock('react-spring', () => ({
-  useSpring: jest.fn().mockImplementation(() => [{ mockProp: 1 }, jest.fn()]),
-  animated: {
-    path: () => <path data-testid="ANIMATED-COMPONENT" />,
-    div: () => <div data-testid="ANIMATED-COMPONENT" />,
-  },
-}))
-/* eslint-enable */
-
 describe('FileTree component', () => {
   it('renders with default props', () => {
     const { asFragment } = render(<FileTree />)
diff --git a/packages/openneuro-app/src/scripts/dataset/files/file-tree-loading.jsx b/packages/openneuro-app/src/scripts/dataset/files/file-tree-loading.jsx
deleted file mode 100644
index 50b415b9bf..0000000000
--- a/packages/openneuro-app/src/scripts/dataset/files/file-tree-loading.jsx
+++ /dev/null
@@ -1,65 +0,0 @@
-import React from 'react'
-import PropTypes from 'prop-types'
-import { useSpring, animated } from 'react-spring'
-import styled from '@emotion/styled'
-
-const ProgressOuter = styled.div`
-  width: 100%;
-  height: 2px;
-  background-color: #f5f5f5;
-  margin: 10px 0;
-`
-const ProgressInner = styled(animated.div)`
-  height: 100%;
-  color: white;
-  line-height: 2px;
-  text-align: center;
-  width: 0%;
-`
-
-/**
- * Estimate time to fetch files
- * @param {Navigator} [navigator]
- * @returns {(size: number) => number}
- */
-export const estimateDuration = navigator => size => {
-  // One file is about 100 bytes
-  const estimatedBytes = size * 100
-  if (navigator && 'connection' in navigator) {
-    // Estimate duration precisely if we can
-    const downlink = navigator.connection.downlink
-    return (estimatedBytes / (downlink * 1024)) * 1000 + 50
-  } else {
-    // Fallback estimate of a conservative general connection (10 mbps)
-    return (estimatedBytes / (10 * 1024)) * 1000 + 50
-  }
-}
-
-const FileTreeLoading = ({ size }) => {
-  const navRef = typeof navigator === 'undefined' ? undefined : navigator
-  const config = {
-    mass: 5,
-    tension: 2000,
-    friction: 200,
-    duration: estimateDuration(navRef)(size),
-  }
-  const props = useSpring({
-    config,
-    from: {
-      width: '0%',
-      backgroundColor: '#f5f5f5',
-    },
-    to: { width: '100%', backgroundColor: 'var(--secondary)' },
-  })
-  return (
-    <ProgressOuter>
-      <ProgressInner style={props} />
-    </ProgressOuter>
-  )
-}
-
-FileTreeLoading.propTypes = {
-  size: PropTypes.number,
-}
-
-export default FileTreeLoading
diff --git a/packages/openneuro-app/src/scripts/dataset/files/file-tree-unloaded-directory.jsx b/packages/openneuro-app/src/scripts/dataset/files/file-tree-unloaded-directory.jsx
index cbf0918d9c..608da7a337 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/file-tree-unloaded-directory.jsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/file-tree-unloaded-directory.jsx
@@ -1,7 +1,6 @@
 import React, { useState, useContext, useEffect } from 'react'
 import PropTypes from 'prop-types'
 import DatasetQueryContext from '../../datalad/dataset/dataset-query-context.js'
-import FileTreeLoading from './file-tree-loading.jsx'
 import { gql } from '@apollo/client'
 import { AccordionTab } from '@openneuro/components/accordion'
 
@@ -77,26 +76,16 @@ export const fetchMoreDirectory = (
   })
 
 const FileTreeUnloadedDirectory = ({ datasetId, snapshotTag, directory }) => {
-  const [loading, setLoading] = useState(false)
-  const [displayLoading, setDisplayLoading] = useState(false)
   const { fetchMore } = useContext(DatasetQueryContext)
-  useEffect(() => {
-    if (loading) {
-      const timer = setTimeout(() => setDisplayLoading(true), 150)
-      return () => clearTimeout(timer)
-    }
-  }, [loading])
   return (
     <AccordionTab
       label={directory.filename.split(':').pop()}
       accordionStyle="file-tree"
       onClick={() => {
-        // Show a loading state while we wait on the directory to stream in
-        setLoading(true)
         fetchMoreDirectory(fetchMore, datasetId, snapshotTag, directory)
         // No need to clear since this component is unmounted immediately
       }}>
-      <FileTreeLoading size={directory.size} />
+      <div>Loading...</div>
     </AccordionTab>
   )
 }
diff --git a/yarn.lock b/yarn.lock
index 63ea32677a..3bc26b5d6d 100644
--- a/yarn.lock
+++ b/yarn.lock
@@ -2960,7 +2960,7 @@ __metadata:
   languageName: node
   linkType: hard
 
-"@babel/runtime@npm:^7.10.2, @babel/runtime@npm:^7.12.5, @babel/runtime@npm:^7.13.10, @babel/runtime@npm:^7.3.1, @babel/runtime@npm:^7.5.5, @babel/runtime@npm:^7.7.2, @babel/runtime@npm:^7.7.6, @babel/runtime@npm:^7.8.4, @babel/runtime@npm:^7.8.7, @babel/runtime@npm:^7.9.2":
+"@babel/runtime@npm:^7.10.2, @babel/runtime@npm:^7.12.5, @babel/runtime@npm:^7.13.10, @babel/runtime@npm:^7.5.5, @babel/runtime@npm:^7.7.2, @babel/runtime@npm:^7.7.6, @babel/runtime@npm:^7.8.4, @babel/runtime@npm:^7.8.7, @babel/runtime@npm:^7.9.2":
   version: 7.15.4
   resolution: "@babel/runtime@npm:7.15.4"
   dependencies:
@@ -4974,7 +4974,6 @@ __metadata:
     react-dom: ^17.0.1
     react-helmet: 6.1.0
     react-router-dom: 6.3.0
-    react-spring: ^8.0.27
     react-toastify: 6.0.9
     react-usestateref: ^1.0.5
     react-virtualized: "remorses/react-virtualized-fixed-import.git#9.22.3"
@@ -18859,19 +18858,6 @@ __metadata:
   languageName: node
   linkType: hard
 
-"react-spring@npm:^8.0.27":
-  version: 8.0.27
-  resolution: "react-spring@npm:8.0.27"
-  dependencies:
-    "@babel/runtime": ^7.3.1
-    prop-types: ^15.5.8
-  peerDependencies:
-    react: ">= 16.8.0"
-    react-dom: ">= 16.8.0"
-  checksum: 4f306e30c3a425fd2b11c265ca0a7c261de0f63c0250fa6fa19eddd58c50fc9eaa463927571ee1dec39659a1bf619aaacf3352602b7724695da240ec0bc106cf
-  languageName: node
-  linkType: hard
-
 "react-toastify@npm:6.0.9":
   version: 6.0.9
   resolution: "react-toastify@npm:6.0.9"

From 4556161137636e1c37119ece59fdbcd7aa84b88a Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Wed, 5 Oct 2022 11:11:59 -0700
Subject: [PATCH 30/34] fix(app): Use annexed boolean for File component

---
 packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx b/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
index 6a4397cbf6..e8236313a5 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
@@ -135,7 +135,7 @@ const FileTree = ({
                   filename={file.filename.split(':').pop()}
                   annexKey={file.key}
                   datasetPermissions={datasetPermissions}
-                  annexed={file.key}
+                  annexed={file.annexed}
                   isMobile={false}
                 />
               </li>

From 9550c69724bf534d61fae3f42d0ffcbdae98997d Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Wed, 5 Oct 2022 11:12:29 -0700
Subject: [PATCH 31/34] tests(app): Test fileTreeLevels behavior to render
 files at correct depth

---
 .../files/__tests__/file-tree.spec.jsx        | 107 +++++++++++++++++-
 .../src/scripts/dataset/files/file-tree.tsx   |  34 +++---
 2 files changed, 127 insertions(+), 14 deletions(-)

diff --git a/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree.spec.jsx b/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree.spec.jsx
index d90de6744a..2e2ea93f70 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree.spec.jsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/__tests__/file-tree.spec.jsx
@@ -1,7 +1,7 @@
 import React from 'react'
 import { render, screen, fireEvent } from '@testing-library/react'
 import { MockedProvider } from '@apollo/client/testing'
-import FileTree, { unescapePath } from '../file-tree'
+import FileTree, { unescapePath, fileTreeLevels } from '../file-tree'
 
 // official Jest workaround for mocking methods not implemented in JSDOM
 window.matchMedia =
@@ -14,6 +14,111 @@ window.matchMedia =
     }
   }
 
+const datasetFiles = [
+  {
+    id: 'b42624c6aea63fc5e3f6f3e712d9e44adc4dbfdc',
+    key: '834b88a80109f1b38e0ab85999090170889469ce',
+    filename: 'CHANGES',
+    size: 59,
+    directory: false,
+    annexed: false,
+  },
+  {
+    id: '63888a199a5ce37377b1cd708cda59577dad218f',
+    key: 'fa84e5f958ec72d42b3e196e592f6db9f7104b19',
+    filename: 'README',
+    size: 709,
+    directory: false,
+    annexed: false,
+  },
+  {
+    id: 'a2922b427c5c997e77ce058e0ce57ffd17123a7f',
+    key: '0b1856b91c11f67098ce60114417a62dd55730a5',
+    filename: 'dataset_description.json',
+    size: 172,
+    directory: false,
+    annexed: false,
+  },
+  {
+    id: 'a6378eea201d9cad639e0bee328e03132d30489d',
+    key: null,
+    filename: 'sub-01',
+    size: 0,
+    directory: true,
+    annexed: false,
+  },
+]
+
+const anatDir = {
+  id: '9703f3f6b4137c2b86a3a712eb34d78bdec9fd72',
+  key: null,
+  filename: 'sub-01:anat',
+  size: 0,
+  directory: true,
+  annexed: false,
+}
+
+const niftiFile = {
+  id: '69fd3617b27125c433ea5f8e0e2052c31828c253',
+  key: 'MD5E-s311112--bc8bbbacfd2ff823c2047ead1afec9b3.nii.gz',
+  filename: 'sub-01:anat:sub-01_T1w.nii.gz',
+  size: 311112,
+  directory: false,
+  annexed: true,
+}
+
+describe('fileTreeLevels()', () => {
+  it('handles top level files correctly', () => {
+    const { childFiles, currentFiles } = fileTreeLevels('', datasetFiles)
+    expect(currentFiles).toEqual(
+      expect.arrayContaining([
+        currentFiles.find(
+          f => f.id === 'a2922b427c5c997e77ce058e0ce57ffd17123a7f',
+        ),
+      ]),
+    )
+    expect(childFiles).toEqual({})
+  })
+  it('passes childFiles to the next level', () => {
+    const levelOneFiles = [...datasetFiles, anatDir]
+    const { childFiles, currentFiles } = fileTreeLevels('', levelOneFiles)
+    expect(currentFiles).toEqual(
+      expect.arrayContaining([
+        currentFiles.find(
+          f => f.id === 'a2922b427c5c997e77ce058e0ce57ffd17123a7f',
+        ),
+      ]),
+    )
+    expect(childFiles['sub-01']).toEqual(expect.arrayContaining([anatDir]))
+  })
+  it('passes two level deep childFiles to the next level', () => {
+    const levelTwoFiles = [...datasetFiles, anatDir, niftiFile]
+    const { childFiles, currentFiles } = fileTreeLevels('', levelTwoFiles)
+    expect(currentFiles).toEqual(
+      expect.arrayContaining([
+        currentFiles.find(
+          f => f.id === 'a2922b427c5c997e77ce058e0ce57ffd17123a7f',
+        ),
+      ]),
+    )
+    expect(childFiles['sub-01']).toEqual(expect.arrayContaining([niftiFile]))
+  })
+  it('passes two level deep childFiles to the next level', () => {
+    const levelTwoFiles = [anatDir, niftiFile]
+    const { childFiles, currentFiles } = fileTreeLevels('sub-01', levelTwoFiles)
+    expect(currentFiles).toEqual(
+      expect.arrayContaining([
+        currentFiles.find(
+          f => f.id === '9703f3f6b4137c2b86a3a712eb34d78bdec9fd72',
+        ),
+      ]),
+    )
+    expect(childFiles['sub-01:anat']).toEqual(
+      expect.arrayContaining([niftiFile]),
+    )
+  })
+})
+
 describe('FileTree component', () => {
   it('renders with default props', () => {
     const { asFragment } = render(<FileTree />)
diff --git a/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx b/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
index e8236313a5..49f8cd2a97 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/file-tree.tsx
@@ -23,19 +23,10 @@ interface FileTreeProps {
   bulkDeleteButton: JSX.Element
 }
 
-const FileTree = ({
-  datasetId,
-  snapshotTag = null,
-  path = '',
-  name = '',
-  files = [],
-  editMode = false,
-  defaultExpanded = false,
-  datasetPermissions,
-  toggleFileToDelete,
-  isFileToBeDeleted,
-  bulkDeleteButton,
-}: FileTreeProps): JSX.Element => {
+export function fileTreeLevels(
+  path: string,
+  files: DatasetFile[],
+): { currentFiles: DatasetFile[]; childFiles: Record<string, DatasetFile[]> } {
   // Split files into a tree for this level and child levels
   // Special cases for root (path === '')
   const currentFiles = []
@@ -59,6 +50,23 @@ const FileTree = ({
       currentFiles.push(f)
     }
   }
+  return { currentFiles, childFiles }
+}
+
+const FileTree = ({
+  datasetId,
+  snapshotTag = null,
+  path = '',
+  name = '',
+  files = [],
+  editMode = false,
+  defaultExpanded = false,
+  datasetPermissions,
+  toggleFileToDelete,
+  isFileToBeDeleted,
+  bulkDeleteButton,
+}: FileTreeProps): JSX.Element => {
+  const { childFiles, currentFiles } = fileTreeLevels(path, files)
   return (
     <AccordionTab
       className=""

From 90f1fa37d93ed6dce56ba0a86fe81573efee5220 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Wed, 5 Oct 2022 11:17:14 -0700
Subject: [PATCH 32/34] fix(app): Show the filename for any failed files and
 suggest a user retry.

---
 .../src/scripts/dataset/download/download-native.js        | 2 +-
 .../src/scripts/dataset/download/native-file-toast.jsx     | 7 +++++--
 2 files changed, 6 insertions(+), 3 deletions(-)

diff --git a/packages/openneuro-app/src/scripts/dataset/download/download-native.js b/packages/openneuro-app/src/scripts/dataset/download/download-native.js
index c026771541..a111f8fa90 100644
--- a/packages/openneuro-app/src/scripts/dataset/download/download-native.js
+++ b/packages/openneuro-app/src/scripts/dataset/download/download-native.js
@@ -101,7 +101,7 @@ const downloadTree = async (
         await body.pipeThrough(progress).pipeTo(writable)
       } else {
         apmTransaction.captureError(statusText)
-        return requestFailureToast()
+        return requestFailureToast(file.filename)
       }
     }
   }
diff --git a/packages/openneuro-app/src/scripts/dataset/download/native-file-toast.jsx b/packages/openneuro-app/src/scripts/dataset/download/native-file-toast.jsx
index 4d434cfbac..676caa85ed 100644
--- a/packages/openneuro-app/src/scripts/dataset/download/native-file-toast.jsx
+++ b/packages/openneuro-app/src/scripts/dataset/download/native-file-toast.jsx
@@ -41,10 +41,13 @@ export const nativeErrorToast = () => {
   )
 }
 
-export const requestFailureToast = () => {
+export const requestFailureToast = filename => {
   toast.error(
     <ToastContent title="Download Error" body="A file failed to download">
-      <p>You may not have access to download this dataset.</p>
+      <p>
+        {filename} failed. Retry your download to reattempt downloading this
+        file.
+      </p>
     </ToastContent>,
   )
 }

From b9e12435595e25926034ed7b834b5bfa52bd8c1d Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Wed, 5 Oct 2022 11:37:21 -0700
Subject: [PATCH 33/34] fix(worker): Simplify removing annex objects to avoid
 get_repo_files call

---
 .../datalad_service/handlers/annex_objects.py | 17 +++---------
 .../datalad/datalad_service/tasks/files.py    |  8 ++++++
 .../datalad/datalad_service/tasks/publish.py  | 27 -------------------
 3 files changed, 12 insertions(+), 40 deletions(-)

diff --git a/services/datalad/datalad_service/handlers/annex_objects.py b/services/datalad/datalad_service/handlers/annex_objects.py
index c869d12733..350aab0ac9 100644
--- a/services/datalad/datalad_service/handlers/annex_objects.py
+++ b/services/datalad/datalad_service/handlers/annex_objects.py
@@ -1,10 +1,7 @@
 import logging
-import gevent
 
 import falcon
 
-from datalad_service.common.annex import get_repo_files
-from datalad_service.tasks.publish import remove_file_remotes
 from datalad_service.tasks.files import remove_annex_object
 
 
@@ -18,16 +15,10 @@ def on_delete(self, req, resp, dataset, snapshot, annex_key):
         """Delete an existing annex_object on a dataset"""
         if annex_key:
             dataset_path = self.store.get_dataset_path(dataset)
-            files = get_repo_files(dataset_path, snapshot)
-            try:
-                file = next(f for f in files if annex_key == f.get('key'))
-            except StopIteration:
+            if (not remove_annex_object(dataset_path, annex_key)):
+                # Failed to remove, the key most likely does not exist
                 resp.media = {'error': 'file does not exist'}
-                resp.status = falcon.HTTP_BAD_REQUEST
-            urls = file.get('urls')
-
-            gevent.spawn(remove_file_remotes, urls)
-            gevent.spawn(remove_annex_object, dataset_path, annex_key)
+                resp.status = falcon.HTTP_NOT_FOUND
         else:
             resp.media = {'error': 'annex-key is missing'}
-            resp.status = falcon.HTTP_NOT_FOUND
+            resp.status = falcon.HTTP_BAD_REQUEST
diff --git a/services/datalad/datalad_service/tasks/files.py b/services/datalad/datalad_service/tasks/files.py
index bc4e803137..c45acc772c 100644
--- a/services/datalad/datalad_service/tasks/files.py
+++ b/services/datalad/datalad_service/tasks/files.py
@@ -62,5 +62,13 @@ def remove_annex_object(dataset_path, annex_key):
     ) as drop_object:
         for i, line in enumerate(drop_object.stdout):
             if i == 0 and line[-2:] == 'ok':
+                # If successful, delete from s3-PUBLIC as well
+                subprocess.Popen(
+                    ['git-annex', 'drop', '--force',
+                        f'--key={annex_key}', '--from=s3-PUBLIC'],
+                    cwd=dataset_path,
+                    stdout=subprocess.PIPE,
+                    encoding='utf-8'
+                )
                 return True
     return False
diff --git a/services/datalad/datalad_service/tasks/publish.py b/services/datalad/datalad_service/tasks/publish.py
index 9e64afedcd..34c492c692 100644
--- a/services/datalad/datalad_service/tasks/publish.py
+++ b/services/datalad/datalad_service/tasks/publish.py
@@ -169,30 +169,3 @@ def monitor_remote_configs(dataset_path):
     s3_ok = datalad_service.common.s3.validate_s3_config(dataset_path)
     if not s3_ok:
         update_s3_sibling(dataset_path)
-
-
-def remove_file_remotes(urls):
-    """Removes the remotes for the file with the given annex key."""
-    for url in urls:
-        if 's3.amazonaws.com' in url:
-            remove_object_from_s3(url)
-        else:
-            logger.debug(f'url is not in S3')
-
-
-def remove_object_from_s3(url):
-    m = re.match(r'.*?(?:s3\.amazonaws\.com\/)(.*?)\/(.*?)(?:\?|$)', url)
-    bucket = m[1]
-    filepath = m[2]
-    version_id = re.match(r'.*?[?&]versionId=([^&]+).*$',
-                          url)[1] if 'versionId=' in url else None
-    client = boto3.client(
-        's3',
-        aws_access_key_id=AWS_ACCESS_KEY_ID,
-        aws_secret_access_key=AWS_SECRET_ACCESS_KEY,
-    )
-    client.delete_object(
-        Bucket=bucket,
-        Key=filepath,
-        VersionId=version_id,
-    )

From ecf0804c10b734f37bb28ff513a5858263067d72 Mon Sep 17 00:00:00 2001
From: Nell Hardcastle <nell@dev-nell.com>
Date: Wed, 5 Oct 2022 12:29:38 -0700
Subject: [PATCH 34/34] fix(app): Fix file.size type for File leaf component

---
 packages/openneuro-app/src/scripts/dataset/files/file.tsx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/packages/openneuro-app/src/scripts/dataset/files/file.tsx b/packages/openneuro-app/src/scripts/dataset/files/file.tsx
index 3c1d97420b..53abce438d 100644
--- a/packages/openneuro-app/src/scripts/dataset/files/file.tsx
+++ b/packages/openneuro-app/src/scripts/dataset/files/file.tsx
@@ -81,7 +81,7 @@ export const apiPath = (datasetId, snapshotTag, filePath) => {
 
 interface FileProps {
   id: string
-  size: number
+  size: bigint
   datasetId: string
   path: string
   filename: string