-
Notifications
You must be signed in to change notification settings - Fork 14
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Erreur import gros fichiers #2136
Comments
Je confirme, je viens d'essayer avec un csv de de plus de 456 245 lignes (revue de sommaire ISTEX) sur Chrome avec la v14.0.60 et le chargement s'est arrêté à 112 500 lignes avec la même erreur. |
Je vais compléter cette issue plutôt que d'en ouvrir une nouvelle car les problèmes que j'ai rencontré sont sans doute liés. Pour pallier à ce problème d'import de gros fichiers j'ai segmenté les opérations ou les fichiers à charger et un autre problème apparaît.
Chargement d'un corpus via requetage d'openalex. J'importe un 1er lot de 57 000 notices sans problème. Je veux le compléter avec 50 000 autres notices, tout se déroule bien, on peut voir dans l'instance au cours du chargement que j'ai effectivement plus de 57 000 notices et lorsque l'on arrive à la fin du processus toute les données disparaissent (107 000 donc ) avec le message suivant !
Chargement d'un corpus via plusieurs fichiers json-l. 1er upload de 20 000 lignes environ chargé. 2ème upload de 25 000 chargé également. L'instance comporte bien le contenu des 2 fichiers. 3 ème upload de 25 000 aussi le processus va à son terme et au moment où la page se rafraîchit pour normalement afficher le total des 3 fichiers j'ai 0 lignes, instance vide avec toujours le message "l'import a été annulé avec succès" les logs de l'instance : |
Logs d'un 3eme test
|
Dans le log du 2e test, on a les mêmes erreurs:
Y-a-t-il encore assez de place disque sur la machine ? |
114 go libre sur la machine, et sur le container je ne peux pas dire j'ai une page "Maintenance en cours" mais il restait largement assez de place de mémoire |
Ce problème visiblement fait planter le serveur qui redémarre automatiquement. Du coup pendant le temps du redémarrage, il n'est plus joignable, ce qui pourrait expliquer l'erreur ECONNECT |
Pour info, en local, l'import de revue de sommaire ne pose aucun pb |
Décrire le bogue
A partir de la version 14.0.40, l'import de gros fichiers (plus de 400 000 lignes) ne s'achève jamais
Parfois un message d'erreur apparait (versions les plus récentes) : voir capture plus bas.
Testé en versions 14.0.59, 56, 51, 45, 41, 40 et 39.
Reproduire
Étapes pour reproduire le comportement :
Comportement attendu
Import complet du fichier (opérationnel jusqu'à la version 14.0.39)
Captures d'écran
![erreur-import-rs-lodex14059](https://private-user-images.githubusercontent.com/26866546/357043017-635a7196-806d-48ba-b728-d4ed986b2e5f.PNG?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MzkyMTkwNDEsIm5iZiI6MTczOTIxODc0MSwicGF0aCI6Ii8yNjg2NjU0Ni8zNTcwNDMwMTctNjM1YTcxOTYtODA2ZC00OGJhLWI3MjgtZDRlZDk4NmIyZTVmLlBORz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNTAyMTAlMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjUwMjEwVDIwMTkwMVomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPTUwMTViMWU4OGRjYzZhOTgwNzUwOTVkMWFjNzg3NTJlMDUyNzdkNzFmZTBlNTM3ZWI0OTc5OWEzNjdjMDJlMTgmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0In0.SMraNQO87OQTohzqp2fPlx3b7q-vYNWibVe5gZsFjlE)
Environnement (veuillez compléter les informations suivantes) :
Contexte supplémentaire
Ajoutez ici tout autre contexte relatif au problème.
The text was updated successfully, but these errors were encountered: