J'ai un script Python qui importe un grand fichier CSV, puis compte le nombre d'occurrences de chaque mot dans le fichier, puis exporte les comptes dans un autre fichier CSV.
Mais ce qui se passe, c'est qu'une fois que la partie du comptage est terminée et que l'exportation commence, il affiche Killed
dans le terminal.
Je ne pense pas que ce soit un problème de mémoire (si c'était le cas, je suppose que j'obtiendrais une erreur de mémoire et pas Killed
).
Est-ce que le processus prendrait trop de temps ? Si oui, y a-t-il un moyen de prolonger la période de time-out pour éviter cela ?
Voici le code :
csv.field_size_limit(sys.maxsize)
counter={}
with open("/home/alex/Documents/version2/cooccur_list.csv",'rb') as file_name:
reader=csv.reader(file_name)
for row in reader:
if len(row)>1:
pair=row[0]+' '+row[1]
if pair in counter:
counter[pair]+=1
else:
counter[pair]=1
print 'finished counting'
writer = csv.writer(open('/home/alex/Documents/version2/dict.csv', 'wb'))
for key, value in counter.items():
writer.writerow([key, value])
Et le Killed
se produit après que finished counting
a été imprimé, et le message complet est :
killed (program exited with code: 137)