Skip to article frontmatterSkip to article content

Licence CC BY-NC-ND, Thierry Parmentelat & Aurélien Noce

on va faire quoi ?

modalités du TP

les fichiers et l’OS

c’est quoi l’OS ?

questions préliminaires

lire un fichier simple

(le fichier data/hello.txt fait partie du zip)

ouverture d’un fichier

f = open("data/hello.txt")

les types

il faut fermer !

que se passe-t-il si on oublie de fermer le fichier ?

on va écrire un code qui ouvre n fichiers le faire tourner avec n= 10, 100, 1000, ...

pouvez-vous prédire ce qui va passer ?

l’idiome pour lire un fichier: with & for

contenu des fichiers texte

on va regarder dans les yeux deux fichiers texte:

ASCII

Unicode

faites pareil avec data/bonjour.txt

un fichier binaire

faites pareil avec data/tiny.pickle

les différents formats de fichier

Tout le monde ne crée pas sa propre structure (on dit aussi format) de fichier !
Il existe des formats standard qui permettent une interaction entre les programmes, et même différents langages de programmation !

le format pickle

c’est le format intégré de Python:

à faire:

pickle : écriture

autre format: json

à vous de jouer

encore un: yaml

et aussi: les csv

on recommence (c’est optionnel, si vous savez déjà lire un csv avec pandas)...

formats custom

comment peut-on lire (on dit parse) des formats de fichiers inconnus ?
pour cela, 2 armes

exercice: lisez data/notes.txt

exercice: écrivez un programme

épilogue: les regexps, en deux mots

sans transition..

exemple de regexp

ab((cd)|(ef))* décrit un ensemble qui