Lundi 12 et mardi 13 décembre formation technique |
---|
Journées assurées par Didier BELLAMY
-Horaires : 9h30/12h30 - 13h30/17h30 (je vais demander 10h-18h pour la première journée)
- Pré-requis : connaissances Apache, Mysql, base de données
- Contenu : formation à l'installation et la MAJ de PMB, outils d'aide à la migration de données
- Contenu détaillé (jour 1 et 2) :
Les statuts des documents permettent de savoir si les notices, les exemplaires, les documents numériques sont visualisables par l'utilisateur.
Les origines d'une document permettent de savoir d'où vient la notice, si elle est interne, ou appartient au catalogue de la BNF.
Attention il faut qu'entre les notices et les exemplaires, les champs personnalisables soient cohérents entre eux.
Par ailleurs on peut préciser si chaque champ est exportable (si un champ est vraiment propre à un catalogue on ne permet pas de l'exporter).
Dans l'onglet document /nouvelle notice
La notice a plusieurs champs standards dans le logiciel: besoin d'un titre, d'un type de document… La liste proposée est issue de la norme Unimarc (en dur dans les fichier). Par exemple pour le type de documents numériques = texte imprimé, texte manuscrit…. On peut ajouter des types de documents mais cela ne sera pas forcément interopérable.
Chaque notice à besoin à minima (pour la MONOGRAPHIE)
Pour les périodiques:
Pour les tirés à part (proposition de D. Bellamy) :
Ajouter un fichier doctype_subst.xml
Il est nécessaire avant toute chose de se définir un cadre:
Le moissonnage n'est pas une recherche en direct. Il y a import des informations dans une base locale et ensuite on cherche en local.
A l' INRA il existe un catalogue PMB centralisé (https://belinra.inra.fr): possiblité de chercher dans l'ensemble des centres de documentation qui existent et 2 centres à part traités en tant que ressource externe (moissonné).
Question : * si je moissonne différents notice il y a-t-il un identifiant propre dans le catalogue FBCN ou est-ce le permalink qui sert d'identifiant ?
Il existe une maison d'édition de littérature dans les sciences humaines et sociales : possibilité moissonner notices distantes puis et synchroniser l'import des notices dans une bdd locale.
Attention à bien sauvegarder les répertoires qui contiennent les documents physiques.
Le protocole pour communiquer avec les serveurs externes: z39-50 ne supporte pas les proxy. Il faut faire des ouvertures spéciales.
_Remarque_: Il est possible de récupérer des images des notices Amazon à partir des numéros ISBN.
La fondation Mozilla fourni (lets_encrypt, les certificats sont valable 3 mois et renouvelles automatiquement) a fait une autorité de certification de chiffrage des mots de passes qui est gratuite. Document signé certifié avec une clef publique de cryptage délivrée par une autorité. Cette autorité a validé le fait qu'on possède une clef privée et qu'on chiffre le flux. D'un côté j'ai un mot de passe qui permet de crypter les données et qui est privé et un mot de passe qui permet de décrypter ces mots de passe et qui est public.
mysql show global variable like '%engin%'
Pour le moment le serveur de stockage est innoDB mais PMB passe à myISAM (système d'indexation full text qui n'existait pas pour innodb et qui a été ajouté dans la dernière version).
→ demander le fichier exemple au formateur
- Ecraser les fichiers par la nouvelle version - Lancer l'interface d'admin
chmod -R root www-data html/ chmod 750 -R html/
chmod g+ws pmb_documents_numeriques chmod g+ws pmb/temp/ chmod g+ws pmb_documents_numeriques chmod g+ws pmb/opac_css/temp/ chmod g+ws pmb/admin/backup/backup/ chmod g+ws pmb/admin/import/
gestion > admin > Outils > Parametres > Parametres généraux [ESC + x]
Dans les connecteurs sortant→ choisir le connecteur qui exporte des données OAI
pour les connecteurs sortant: on peut rajouter un statut de notice “notice pour export OAI” et choisir que seules les notices avec ce statut sont exportables dans les “sets pour connecteurs sortant”.
Il existe une gestion des doublons sur l'identifiant de notice et l'ISBN (le premier entrant est choisi).
http://multimedia.bnf.fr/unimarcb_trad/Bsection5-Label_notice-6-2010.pdf
Dans \pmb\includes\marc_tables\fr_FR :
Dossier doc_conversion:
Avec l' unimarc, la notion de bulletin n'existe pas.
Le label de notice est un code de 24 caractères avec un type de document, un niveau bibliographique et un niveau hiérarchique
Ensuite il y a des informations réparties en champs (zone) et en sous champs. Le champs est une zone numérique sur 3 chiffres et le sous-champ est '$' + une lettre ou un chiffre.
exemple:
Dans PMB tout n'est pas géré car la norme comprend 900 champs et beaucoup de sous-champs.
Le dossier xampp\xampp\htdocs\pmb\doc contient le fichier import_unimarc.txt qui décrit tous les champs de la norme.
Dans le même dossier le fichier import_unimarc_lien.txt permet de voir les liens pour l'import ou export des notices.
Il existe un outil pour faire de la transformation de csv à xml. Cet outil est intégré à PMB. Il sera présenté en 2ème partie de formation. Il se trouve dans le répertoire convert_import dans PMB
Ils permettent de modifier les configurations de PMB sans modifier les fichiers sources.
Cela concerne les types de documents, les messages dans l'interface, les relations entre notices, le catalogue des fonctions de conversion.
Exemple:
Attention ! Il faut avoir les mêmes documents côté OPAC et PMB pour être cohérent.
Il faut donc que les fichiers subst soient recopiés côté OPAC sinon si par exemple j'ai créé un type “rapport” côté PMB et qu'il n'existe pas côté OPAC, le document n’apparaît pas dans la recherche: c'est bloquant.
Dossier /var/www/html/pmb_cbn_corse/pmb/opac_css/admin/convert/imports:
Dans le fichier Catalog.xml, on voit les formats qu'il est possible d'importer dans PMB (les type avec “yes”)
Remarque :
<dt>b</dt> –pour texte manuscrit
La description des doctype.xml se trouve dans ce dossier : C:\Users\anais\Desktop\PMB\xampp\xampp\htdocs\pmb\includes\marc_tables\fr_FR
Pareil il faut être attentif à l'existence d'un parent pour les articles, les bulletins
Si on veut faire le text to iso2709 on va dans le fichier params.xml du dossier pmbxml2marciso et on copie colle la balise <step>
Voir dans PMB_explication_convertion c'est expliqué.
reprendre le CSV et le params.xml de l'exemple du fichier de Corse.
Didier Bellamy doit aussi nous fournir les types de champs perso.
Définir le mapping entre les champs du CSV et les champs de PMB
Pour les champs les plus communs
* Auteur : * 700 = Si 1 Auteur unique * 701 = Si plusieurs auteurs * 702 = Auteurs secondaires (par ex traducteur ...) * $a = nom * $b = prénom * Date publication : * 210 $d = Date de pluli * Titre : * 200 $a = Titre * 200 $i = Titre de série (si monographie) * Numéro : * 200 $h = Numéro dans la série (si monographie) * Page : * 215 $a = Num de page * Mots clefs (utilisation d'un thésaurus) : * 610 $a = Mots clefs libre dans la notice * 676 = Si plan de classement * 606 $a = Si associés à un thésaurus * Site de la zone d'étude : * 610 $a = Mots clefs libre dans la notice * 676 = Si plan de classement * 606 $a = Si associés à un thésaurus * Numéro ISBN : * 010 $a = code * ID bd source (= nouveau champ non par défaut dans PMB) * Champs perso de PMB : * 900 $a = <valeur> * 900 $n = <nom> * 900 $l = <libelle> * Cote & licalisation dbiblio : * 995 $a = localisation * 995 $f = Num de code barre (ou d'exemplaire) (*) * 995 $k = cote (*) * 995 $q = public visé * 995 $r = Type de document (support) (*) * 995 $u = Commentaire non bloquant (*) = champs obligatoires
aix2pmbxml permet de traiter des sorties de logiciel superdoc.
A l'origine il s'agit d'une sortie xml de Superdoc qui va avoir des tag xml superdoc (particulier).
Type d'entrée=xml
rootelement: inmrecordset
Etapes de transformation: des étapes qui s'enchainent.
La feuille xsl permet de compléter la transformation si certaines choses ne sont pas passées dans le “mapping” traditionnel. C'est du xml qui permet en plus des transformations avec des fonctions.
Cela récupère des balises dans le fichier d'origine et les transforme en autre choses. Cela permet de mettre des conditions pour le mapping (cela prend en compte les valeurs contenues dans les champs).
Par exemple pour mes mots clefs, si les séparateurs sont du ; ou de la , on expose le champs en fonction soit de la virgule soit du point virgule…