Projet

Général

Profil

En préparation (HFC V20) » Historique » Version 5

Xavier Bonnin, 05/04/2017 17:46

1 1 Xavier Bonnin
h1. En préparation (HFC V20)
2
3 2 Xavier Bonnin
*Cette page présente la nouvelle architecture du HFC prévue dans la version 2.0 (voir branch feature/hfc200 sur dépôt https://gitlab.obspm.fr/HELIO/HELIO-HFC pour le code source).
4 1 Xavier Bonnin
Les informations fournies sur cette page sont donc susceptibles de changer!*
5
6
h2. Description générale
7
8
La figure ci-dessous présente l'enchaînement de processus (worfklow) opéré par le pipeline du HFC pour traiter, insérer et rendre visible les données.
9
Ce workflow est exécuté toute les nuits de manière automatique: lancement via cron depuis la machine tycho pour l'execution des codes et le transfert des fichiers produits sur le serveur ftpbass2000. Puis lancement quelques heures plus tard toujours via cron mais depuis la machine voparis-helio, de l'insertion dans la base des données des nouveaux fichiers sur ftpbass2000. Les 3 tâches "exécution des codes", "copie sur le serveur ftp" et "insertion dans la base" sont indépendantes et réalisées par des scripts différents (voir plus bas).
10
11
!{width: 60%}helio_hfc_v2_dataflow_v1.png!
12
13
Les étapes de ce workflow ainsi que les interfaces utilisateur (boîtes vertes en bas de la figure) sont décrites dans les sections suivantes.
14
15
h2. Principales étapes du traitement et de la mise à disposition des données
16
17
Les principales étapes du workflow sont les suivantes :
18
# Lancement des FRC sur la machine tycho.obspm.fr par le script run_hfc_frc.sh. Les FRC sont lancés à 1 min d'intervalle, la plupart étant gérée via le gestionnaire SLURM (voir http://dio.obspm.fr/Calcul/tycho/ pour plus de détails) 
19
# Une fois lancé, chaque code va se charger d'aller récupérer les dernières observations à traiter, d’exécuter l'algorithme de détection (ou tracking ou autre), puis de générer les fichiers contenant les résultats de la détection (.csv) et les quickloock (.jpg) des observations. (Sauf exception, chaque produit un jeu de fichiers (.csv, .jpg) par observation. Ces fichiers sont sauvegardés dans un dossier dédié sur tycho (/data) 
20
# Un second script hfc_upload_fr.sh se charge ensuite de lancer la copie sur le serveur ftpbass2000.obspm.fr les derniers fichiers produits par les codes. En pratique hfc_upload_frc.sh appelle un sous-script Python upload_frc.py qui effectue la copie. Les fichiers copiés sont ensuite effacés sur tycho afin de libérer de l'espace (le programme vérifie que les fichiers sont correctement copiés avant de les effacer). 
21 3 Xavier Bonnin
# Un dernier script hfc_insert_fr.sh s'occupe ensuite de l'insertion des données de ces fichiers dans la base du HFC. En pratique hfc_insert_fr.sh appelle, via un sous-script hfc_insert.py, le code Java hfc_insert qui effectue l'insertion.
22 1 Xavier Bonnin
# Les interfaces utilisateur ne nécessitent pas de mise à jour régulière, excepté EPN-TAP dont les vues matérialisées de la base gavo doivent être mises à jour pour correspondre aux derniers données de la base HFC.
23
24
h2. Organisation des fichiers produits par les codes
25
26
Il existe 2 types de fichiers produits par les codes (FRC), des fichiers au format .csv (i.e., fichier ASCII avec le caractère ";" comme séparateur) et des fichiers .jpg pour les images (quicklooks).
27
En principe un jeu de fichiers .csv et .jpg est produit pour chaque fichier d'observation (e.g., image, spectre) traité par un code.
28
29
h3. Les fichiers .csv
30
31
Les fichiers .csv contiennent les paramètres (données) extraits par les codes de détection, ainsi que toutes les informations (meta-données) relatives à l'observation.   
32
Le tableau ci-dessous donne la liste des fichiers .csv à produire par les codes, leur contenu, les extensions standards de fichier attendues, et la ou les tables de la base dans lesquelles les données du fichier sont insérées.
33
34
|_.EXTENSION|_.CONTENU |_.TABLES HFC|
35
| _init.csv| contient les meta-données relatives à l'observation (e.g, résolution de l'image, nom et format du fichier, date de création, etc.) | OBSERVATIONS |
36
| _observatory.csv | contient les méta-données relatives à l'observatoire utilisé pour réaliser l'observation (e.g., type, nom, sous-instrument, caractéristiques, etc.)| OBSERVATORY |
37
| _frc_info.csv | contient les méta-données relatives au code de detection (e.g., nom, version, auteur, référence, etc.)| FRC_INFO |
38
| _feat.csv | contient les paramètres des features detectés (e.g., position, contour, intensité, etc.) | nom de la table liée au feature (e.g., "ACTIVEREGIONS" pour les régions actives) |
39
| _track.csv | contient les données relatives au suivi (tracking) des features | nom de la table tracking liée au feature (e.g., "FILAMENTS_TRACKING" pour le tracking des filaments) |
40
| _norm.csv | contient les méta-données relatives aux observations pré-processées (e.g., pré-traitement opérés, nouvelles caractéristiques, etc.) | PP_OUTPUT |
41
| _pp_info.csv | contient les méta-données relatives au programme de pré-traitement (e.g., nom, version, auteur, référence, etc.) | PP_INFO |
42
43
Pour un code donné, les fichiers .csv sont copiés par le script hfc_ftp_upload.sh sur le serveur ftpbass2000.obspm.fr dans le dossier :
44
45
<pre>
46 4 Xavier Bonnin
/pub/helio/hfc/obsparis/frc/[frc_name]/results/[YYYY]
47 1 Xavier Bonnin
</pre>
48
49
Où [frc_name] est le nom du code (e.g., SDOSS) et [YYYY] l'année de l'observation traitée (4 digits).
50 4 Xavier Bonnin
51
NOTE : le dossier /pub/helio/hfc/obsparis doit être utilisé uniquement pour stocker des données produites à l'Observatoire de Paris. Les données produites à l'IAS devront être copiées dans /pub/helio/hfc/ias.
52 1 Xavier Bonnin
53
h3. Les fichiers .jpg
54
55
La plupart des codes de détection produisent également une image au format jpg de l'observation traitée (par ex., image du soleil ou spectre dynamique). Ces images sont copiées par le programme upload_frc.py sur le serveur ftpbass2000. 
56
57 5 Xavier Bonnin
Les images sont copiées dans un dossier différent des fichiers .csv :
58 1 Xavier Bonnin
59
<pre>
60 5 Xavier Bonnin
/pub/helio/hfc/obsparis/frc/[frc_name]/images/full/[YYYY]/
61 1 Xavier Bonnin
</pre>
62
63 5 Xavier Bonnin
Où [frc_name] est le nom du code et [YYYY] correspond à l'année (sur 4 digits) de l'observation.
64
65
NOTE : Le sous-dossier /full est destiné à accueillir les images reproduisant l'observation "complète" (e.g., disque solaire, spectre journalier), il doit y avoir une image par observation. Pour les images montrant les features, on utilisera le sous-dossier /pub/helio/hfc/obsparis/frc/[frc_name]/images/features/ en classant de la même manière les images par année. Il doit y avoir dans ce cas une image par feature.
66 1 Xavier Bonnin
67
Note: Si deux codes produisent une image .jpg provenant de la même observation, elle n'est donc copiée qu'une fois sur le ftpbass2000.
68
69
h2. Les interfaces utilisateur
70
71
Voir la page [[Interfaces]].