Projet

Général

Profil

Actuelle (HFC V12) » Historique » Version 12

Xavier Bonnin, 05/04/2017 17:35

1 1 Xavier Bonnin
h1. Actuelle (HFC V12)
2
3 11 Xavier Bonnin
Cette page présente la version V1.2 du HFC (voir tag 1.2 sur https://gitlab.obspm.fr/HELIO/HELIO-HFC pour le code source correspondant).
4
Cette version est amenée à être remplacée par la version 2.0.
5
6 2 Xavier Bonnin
h2. Description générale
7 1 Xavier Bonnin
8
La figure ci-dessous présente l'enchaînement de processus (worfklow) opéré par le pipeline du HFC pour traiter, insérer et rendre visible les données.
9 8 Xavier Bonnin
Ce workflow est exécuté toute les nuits de manière automatique: lancement via cron depuis la machine tycho pour l'execution des codes et le transfert des fichiers produits sur le serveur ftpbass2000. Puis lancement quelques heures plus tard toujours via cron mais depuis la machine voparis-helio, de l'insertion dans la base des données des nouveaux fichiers sur ftpbass2000. Les 3 tâches "exécution des codes", "copie sur le serveur ftp" et "insertion dans la base" sont indépendantes et réalisées par des scripts différents (voir plus bas).
10 1 Xavier Bonnin
11
!{width: 60%}helio_hfc_v1.2_dataflow_v1.png!
12
13 2 Xavier Bonnin
Les étapes de ce workflow ainsi que les interfaces utilisateur (boîtes vertes en bas de la figure) sont décrites dans les sections suivantes.
14
15 3 Xavier Bonnin
h2. Principales étapes du traitement et de la mise à disposition des données
16 2 Xavier Bonnin
17 1 Xavier Bonnin
Les principales étapes du workflow sont les suivantes :
18
# Lancement des FRC sur la machine tycho.obspm.fr par le script run_hfc_frc.sh. Les FRC sont lancés à 1 min d'intervalle, la plupart étant gérée via le gestionnaire SLURM (voir http://dio.obspm.fr/Calcul/tycho/ pour plus de détails) 
19 8 Xavier Bonnin
# Une fois lancé, chaque code va se charger d'aller récupérer les dernières observations à traiter, d’exécuter l'algorithme de détection (ou tracking ou autre), puis de générer les fichiers contenant les résultats de la détection (.csv) et les quickloock (.jpg) des observations. (Sauf exception, chaque produit un jeu de fichiers (.csv, .jpg) par observation. Ces fichiers sont sauvegardés dans un dossier dédié sur tycho (/data) 
20
# Un second script hfc_upload_fr.sh se charge ensuite de lancer la copie sur le serveur ftpbass2000.obspm.fr les derniers fichiers produits par les codes. En pratique hfc_upload_frc.sh appelle un sous-script Python upload_frc.py qui effectue la copie. Les fichiers copiés sont ensuite effacés sur tycho afin de libérer de l'espace (le programme vérifie que les fichiers sont correctement copiés avant de les effacer). 
21 12 Xavier Bonnin
# Un dernier script hfc_insert_fr.sh s'occupe ensuite de l'insertion des données de ces fichiers dans la base du HFC. En pratique hfc_insert_fr.sh appelle, via un sous-script hfc_insert.py le code Java hfc_insert qui effectue l'insertion.
22 3 Xavier Bonnin
# Les interfaces utilisateur ne nécessitent pas de mise à jour régulière, excepté EPN-TAP dont les vues matérialisées de la base gavo doivent être mises à jour pour correspondre aux derniers données de la base HFC.
23 1 Xavier Bonnin
24 7 Xavier Bonnin
h2. Organisation des fichiers produits par les codes
25
26
Il existe 2 types de fichiers produits par les codes (FRC), des fichiers au format .csv (i.e., fichier ASCII avec le caractère ";" comme séparateur) et des fichiers .jpg pour les images (quicklooks).
27
En principe un jeu de fichiers .csv et .jpg est produit pour chaque fichier d'observation (e.g., image, spectre) traité par un code.
28
29
h3. Les fichiers .csv
30
31
Les fichiers .csv contiennent les paramètres (données) extraits par les codes de détection, ainsi que toutes les informations (meta-données) relatives à l'observation.   
32
Le tableau ci-dessous donne la liste des fichiers .csv à produire par les codes, leur contenu, les extensions standards de fichier attendues, et la ou les tables de la base dans lesquelles les données du fichier sont insérées.
33
34
|_.EXTENSION|_.CONTENU |_.TABLES HFC|
35
| _init.csv| contient les meta-données relatives à l'observation (e.g, résolution de l'image, nom et format du fichier, date de création, etc.) | OBSERVATIONS |
36
| _observatory.csv | contient les méta-données relatives à l'observatoire utilisé pour réaliser l'observation (e.g., type, nom, sous-instrument, caractéristiques, etc.)| OBSERVATORY |
37
| _frc_info.csv | contient les méta-données relatives au code de detection (e.g., nom, version, auteur, référence, etc.)| FRC_INFO |
38 1 Xavier Bonnin
| _feat.csv | contient les paramètres des features detectés (e.g., position, contour, intensité, etc.) | nom de la table liée au feature (e.g., "ACTIVEREGIONS" pour les régions actives) |
39
| _track.csv | contient les données relatives au suivi (tracking) des features | nom de la table tracking liée au feature (e.g., "FILAMENTS_TRACKING" pour le tracking des filaments) |
40
| _norm.csv | contient les méta-données relatives aux observations pré-processées (e.g., pré-traitement opérés, nouvelles caractéristiques, etc.) | PP_OUTPUT |
41
| _pp_info.csv | contient les méta-données relatives au programme de pré-traitement (e.g., nom, version, auteur, référence, etc.) | PP_INFO |
42 8 Xavier Bonnin
43 9 Xavier Bonnin
Pour un code donné, les fichiers .csv sont copiés par le script hfc_ftp_upload.sh sur le serveur ftpbass2000.obspm.fr dans le dossier :
44 8 Xavier Bonnin
45
<pre>
46
/pub/helio/[frc_name]/[YYYY]
47
</pre>
48 1 Xavier Bonnin
49 9 Xavier Bonnin
Où [frc_name] est le nom du code (e.g., SDOSS) et [YYYY] l'année de l'observation traitée (4 digits).
50
51 1 Xavier Bonnin
h3. Les fichiers .jpg
52 9 Xavier Bonnin
53
La plupart des codes de détection produisent également une image au format jpg de l'observation traitée (par ex., image du soleil ou spectre dynamique). Ces images sont copiées par le programme upload_frc.py sur le serveur ftpbass2000. 
54
55
Pour des raisons "historiques", les images sont copiées dans un dossier différent des fichiers .csv :
56
57
<pre>
58 10 Xavier Bonnin
/temp/qlk/[observat]/[instrume]/[YYYY]/
59 1 Xavier Bonnin
</pre>
60 10 Xavier Bonnin
61
Où [observat], [instrume] et [YYYY] correspond à l'observatoire, l'instrument et l'année (sur 4 digits) de l'observation.
62
63
Note: Si deux codes produisent une image .jpg provenant de la même observation, elle n'est donc copiée qu'une fois sur le ftpbass2000.
64 7 Xavier Bonnin
65 3 Xavier Bonnin
h2. Les interfaces utilisateur
66 5 Xavier Bonnin
67
Voir la page [[Interfaces]].