Insertions en masse plus rapides dans sqlite3 ?

Question

Insertions en masse plus rapides dans sqlite3 ?

Demandé el 12 de Décembre, 2008: Quand la question a-t-elle été
24030 affichage: Nombre de visites la question a
5 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'ai un fichier d'environ 30000 lignes de données que je veux charger dans une base de données sqlite3. Existe-t-il un moyen plus rapide que de générer des instructions d'insertion pour chaque ligne de données ?

Les données sont délimitées dans l'espace et correspondent directement à une table sqlite3. Existe-t-il une méthode d'insertion en masse pour ajouter des données volumineuses à une base de données ?

Quelqu'un a-t-il imaginé un moyen détourné et merveilleux de faire cela si ce n'est pas intégré ?

Avant de commencer, je dois demander s'il existe un moyen C++ de le faire à partir de l'API.

Demandé el 12 de Décembre, 2008 par scubabbl

0 votes

Très pertinent : stackoverflow.com/questions/1711631/

Commenté el 28 de Octobre, 2020 par Ben McIntyre

Answer 1

5 Réponses

Answer 2

61voto

Javier Points 33134

regrouper tous les INSERTs dans une transaction, même s'il n'y a qu'un seul utilisateur, c'est beaucoup plus rapide.
utiliser des déclarations préparées.

Répondu el 12 de Décembre, 2008 par Javier (33134 Points )

0 votes

C'est vrai pour la plupart (toutes ?) des bases de données SQL.

Commenté el 12 de Décembre, 2008 par stesch

2 votes

PRAGMA journal_mode = MEMORY ; Cela pourrait être utile pour certaines personnes.

Commenté el 18 de Mars, 2010 par witkamp

0 votes

stackoverflow.com/questions/43511725/ exemple de transaction pour Nodejs dev

Commenté el 28 de Juin, 2019 par Prashant

Answer 3

43voto

ramanujan Points 2108

Vous voulez utiliser le .import commandement. Par exemple :

$ cat demotab.txt
44      92
35      94
43      94
195     49
66      28
135     93
135     91
67      84
135     94

$ echo "create table mytable (col1 int, col2 int);" | sqlite3 foo.sqlite
$ echo ".import demotab.txt mytable"  | sqlite3 foo.sqlite

$ sqlite3 foo.sqlite
-- Loading resources from /Users/ramanujan/.sqliterc
SQLite version 3.6.6.2
Enter ".help" for instructions
Enter SQL statements terminated with a ";"
sqlite> select * from mytable;
col1    col2
44      92
35      94
43      94
195     49
66      28
135     93
135     91
67      84
135     94

Notez que cette commande de chargement en masse n'est pas SQL mais plutôt une fonctionnalité personnalisée de SQLite. En tant que telle, elle a une syntaxe bizarre parce que nous la transmettons par l'intermédiaire de echo à l'interpréteur de ligne de commande interactif, sqlite3 .

En PostgreSQL, l'équivalent est COPY FROM : http://www.postgresql.org/docs/8.1/static/sql-copy.html

Dans MySQL, c'est LOAD DATA LOCAL INFILE : http://dev.mysql.com/doc/refman/5.1/en/load-data.html

Une dernière chose : n'oubliez pas de faire attention à la valeur de l'option .separator . C'est un piège très courant lorsque l'on fait des insertions en vrac.

sqlite> .show .separator
     echo: off
  explain: off
  headers: on
     mode: list
nullvalue: ""
   output: stdout
separator: "\t"
    width:

Vous devez explicitement définir le séparateur comme étant un espace, une tabulation ou une virgule avant d'utiliser la commande .import .

Répondu el 17 de Avril, 2009 par ramanujan (2108 Points )

2 votes

C'est génial, et très rapide. 20 minutes réduites à 3 secondes.

Commenté el 12 de Mars, 2011 par Gazzer

0 votes

Est-ce que cela fonctionne pour les tables qui ont des clés primaires auto incrémentées ? J'ai essayé d'utiliser un NULL dans le fichier pour une colonne à incrémentation automatique, mais une erreur s'est produite.

Commenté el 30 de Janvier, 2012 par Aditya Naidu

4 votes

En regardant le code du shell.c de SQLite, .import est juste l'utilisation d'une déclaration préparée dans une transaction.

Commenté el 9 de Août, 2012 par dlanod

Afficher 1 autres commentaires

Answer 4

23voto

flussence Points 5870

Vous pouvez également essayer réglage de quelques paramètres pour en tirer une vitesse supplémentaire. Plus précisément, vous voulez probablement PRAGMA synchronous = OFF; .

Répondu el 12 de Décembre, 2008 par flussence (5870 Points )

24 votes

Pragma synchronous = OFF est une mauvaise idée - cela n'aura pratiquement aucun impact sur les performances pour les insertions en masse, et votre base de données sera corrompue en cas de panne de courant. Une bien meilleure idée est d'envelopper vos insertions dans une transaction.

Commenté el 31 de Août, 2009 par Eamon Nerbonne

15 votes

Envelopper les INSERTS dans une TRANSACTION et utiliser PRAGMA journal_mode = MEMORY ; empêchera les INSERTS d'atteindre le disque jusqu'à la fin de la transaction.

Commenté el 18 de Mars, 2010 par witkamp

4 votes

Attention, la mémoire se corrompt en cas de coupure de courant.

Commenté el 7 de Juin, 2011 par Anders Rune Jensen

Afficher 1 autres commentaires

Answer 5

21voto

paxos1977 Points 25088

Augmenter PRAGMA cache_size à un nombre beaucoup plus important. Cela va augmenter le nombre de pages mises en cache en mémoire. REMARQUE : cache_size est un paramètre par connexion.
Regroupez toutes les insertions en une seule transaction plutôt que d'effectuer une transaction par ligne.
Utilisez des instructions SQL compilées pour effectuer les insertions.
Enfin, comme nous l'avons déjà mentionné, si vous êtes prêt à renoncer à une conformité ACID complète, définissez le paramètre PRAGMA synchronous = OFF; .

Répondu el 13 de Décembre, 2008 par paxos1977 (25088 Points )

1 votes

PRAGMA default_cache_size est maintenant déprécié

Commenté el 19 de Mars, 2019 par david

1 votes

cache_size peut être utilisé à la place de l'option dépréciée default_cache_size . Cependant, cache_size est pour une seule connexion.

Commenté el 30 de Mai, 2020 par golmschenk

Answer 6

13voto

Hannes de Jager Points 1588

RE : "Existe-t-il un moyen plus rapide que de générer des instructions d'insertion pour chaque ligne de données ?"

Premier : Réduire le nombre de requêtes SQL à 2 en utilisant la fonctionnalité de Sqlite3 API de table virtuelle par exemple

create virtual table vtYourDataset using yourModule;
-- Bulk insert
insert into yourTargetTable (x, y, z)
select x, y, z from vtYourDataset;

L'idée est d'implémenter une interface C qui lit votre ensemble de données source et le présente à SQlite sous la forme d'une table virtuelle, puis vous effectuez une copie SQL de la source vers la table cible en une seule fois. Cela semble plus difficile que ça ne l'est réellement et j'ai mesuré d'énormes améliorations de vitesse de cette façon.

Deuxièmement : utilisez les autres conseils fournis ici, à savoir les paramètres de pragma et l'utilisation d'une transaction.

Troisièmement, voyez si vous pouvez supprimer certains des index de la table cible. De cette façon, sqlite aura moins d'index à mettre à jour pour chaque ligne insérée.

Répondu el 17 de Juin, 2010 par Hannes de Jager (1588 Points )

1 votes

+1 celui-ci est en fait une façon "c" de le faire à partir de l'API (comme demandé), bien joué.

Commenté el 29 de Juin, 2011 par AlexD

Insertions en masse plus rapides dans sqlite3 ?

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Insertions en masse plus rapides dans sqlite3 ?

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: