Table des matières

JOUR 1 et 2: Module Technique

Lundi 12 et mardi 13 décembre formation technique

Journées assurées par Didier BELLAMY

-Horaires : 9h30/12h30 - 13h30/17h30 (je vais demander 10h-18h pour la première journée)
- Pré-requis : connaissances Apache, Mysql, base de données
- Contenu : formation à l'installation et la MAJ de PMB, outils d'aide à la migration de données
- Contenu détaillé (jour 1 et 2) :

Tour de table, bagage informatique de chacun?

Historique, présentation logiciel

Les onglets du backoffice:

Vocabulaire

Onglet administration:

Les statuts des documents permettent de savoir si les notices, les exemplaires, les documents numériques sont visualisables par l'utilisateur.
Les origines d'une document permettent de savoir d'où vient la notice, si elle est interne, ou appartient au catalogue de la BNF.

Attention il faut qu'entre les notices et les exemplaires, les champs personnalisables soient cohérents entre eux.
Par ailleurs on peut préciser si chaque champ est exportable (si un champ est vraiment propre à un catalogue on ne permet pas de l'exporter).

Création d'une nouvelle notice

Dans l'onglet document /nouvelle notice
La notice a plusieurs champs standards dans le logiciel: besoin d'un titre, d'un type de document… La liste proposée est issue de la norme Unimarc (en dur dans les fichier). Par exemple pour le type de documents numériques = texte imprimé, texte manuscrit…. On peut ajouter des types de documents mais cela ne sera pas forcément interopérable.

Chaque notice à besoin à minima (pour la MONOGRAPHIE)

Pour les périodiques:

Pour les tirés à part (proposition de D. Bellamy) :

Gestion des types de documents

Ajouter un fichier doctype_subst.xml

Catalogage

Il est nécessaire avant toute chose de se définir un cadre:

Moissonnage

Le moissonnage n'est pas une recherche en direct. Il y a import des informations dans une base locale et ensuite on cherche en local.
A l' INRA il existe un catalogue PMB centralisé (https://belinra.inra.fr): possiblité de chercher dans l'ensemble des centres de documentation qui existent et 2 centres à part traités en tant que ressource externe (moissonné).

Question : * si je moissonne différents notice il y a-t-il un identifiant propre dans le catalogue FBCN ou est-ce le permalink qui sert d'identifiant ?

Il existe une maison d'édition de littérature dans les sciences humaines et sociales : possibilité moissonner notices distantes puis et synchroniser l'import des notices dans une bdd locale.

Installation du logiciel

Librairies

Fichier de conf

Attention à bien sauvegarder les répertoires qui contiennent les documents physiques.

Ouverture vers l'extérieure

Le protocole pour communiquer avec les serveurs externes: z39-50 ne supporte pas les proxy. Il faut faire des ouvertures spéciales.
_Remarque_: Il est possible de récupérer des images des notices Amazon à partir des numéros ISBN.

Chiffrage des mots de passe

La fondation Mozilla fourni (lets_encrypt, les certificats sont valable 3 mois et renouvelles automatiquement) a fait une autorité de certification de chiffrage des mots de passes qui est gratuite. Document signé certifié avec une clef publique de cryptage délivrée par une autorité. Cette autorité a validé le fait qu'on possède une clef privée et qu'on chiffre le flux. D'un côté j'ai un mot de passe qui permet de crypter les données et qui est privé et un mot de passe qui permet de décrypter ces mots de passe et qui est public.

Installation de la base de données

mysql show global variable like '%engin%'
Pour le moment le serveur de stockage est innoDB mais PMB passe à myISAM (système d'indexation full text qui n'existait pas pour innodb et qui a été ajouté dans la dernière version).

→ demander le fichier exemple au formateur

Mise à jour

- Ecraser les fichiers par la nouvelle version - Lancer l'interface d'admin

Droits sur les fichiers

chmod -R root www-data html/ chmod 750 -R html/

Droits en écriture

chmod g+ws pmb_documents_numeriques chmod g+ws pmb/temp/ chmod g+ws pmb_documents_numeriques chmod g+ws pmb/opac_css/temp/ chmod g+ws pmb/admin/backup/backup/ chmod g+ws pmb/admin/import/

Paramètres

gestion > admin > Outils > Parametres > Parametres généraux [ESC + x]

Format d'export des notices

OAI/PMH

Dans les connecteurs sortant→ choisir le connecteur qui exporte des données OAI

Faire un set de notices

pour les connecteurs sortant: on peut rajouter un statut de notice “notice pour export OAI” et choisir que seules les notices avec ce statut sont exportables dans les “sets pour connecteurs sortant”.
Il existe une gestion des doublons sur l'identifiant de notice et l'ISBN (le premier entrant est choisi).
http://multimedia.bnf.fr/unimarcb_trad/Bsection5-Label_notice-6-2010.pdf

Unimarc

Dans \pmb\includes\marc_tables\fr_FR :

Dossier doc_conversion:

Avec l' unimarc, la notion de bulletin n'existe pas.
Le label de notice est un code de 24 caractères avec un type de document, un niveau bibliographique et un niveau hiérarchique
Ensuite il y a des informations réparties en champs (zone) et en sous champs. Le champs est une zone numérique sur 3 chiffres et le sous-champ est '$' + une lettre ou un chiffre.
exemple:

Dans PMB tout n'est pas géré car la norme comprend 900 champs et beaucoup de sous-champs.

Le dossier xampp\xampp\htdocs\pmb\doc contient le fichier import_unimarc.txt qui décrit tous les champs de la norme.
Dans le même dossier le fichier import_unimarc_lien.txt permet de voir les liens pour l'import ou export des notices.

Il existe un outil pour faire de la transformation de csv à xml. Cet outil est intégré à PMB. Il sera présenté en 2ème partie de formation. Il se trouve dans le répertoire convert_import dans PMB

Les fichiers subst

Ils permettent de modifier les configurations de PMB sans modifier les fichiers sources.
Cela concerne les types de documents, les messages dans l'interface, les relations entre notices, le catalogue des fonctions de conversion.

Exemple:

Attention ! Il faut avoir les mêmes documents côté OPAC et PMB pour être cohérent.
Il faut donc que les fichiers subst soient recopiés côté OPAC sinon si par exemple j'ai créé un type “rapport” côté PMB et qu'il n'existe pas côté OPAC, le document n’apparaît pas dans la recherche: c'est bloquant.

Conversion de fichier

Dossier /var/www/html/pmb_cbn_corse/pmb/opac_css/admin/convert/imports:
Dans le fichier Catalog.xml, on voit les formats qu'il est possible d'importer dans PMB (les type avec “yes”)

  1. On fait un catalog_subst.xml on ne met que les lignes qui nous intéressent.
  2. On copie le dossier pour la conversion text2pmbxml en text2pmbxml_cbn
  3. Aller dans PMB Gestion :Admin / ConversionsExports / Conversion de fichier externe. La liste 'Type de conversion' doit afficher le contenu du fichier XML 'catalog_subst.xml'
  4. Dans le fichier params.xml, on décrit le type de fichier qu'il va prendre en entrée (ex: text pour les csv) avec le séparateur pipe, le header etc…
  5. Puis on attribue à chaque colonne une correspondance dans les label xml.
  6. Première conversion fichier
  7. CSV CBN→pmb-XML MARC
  8. Puis récupération du xml produit
  9. Deuxième conversions pmb-XML MARC→MARC ISO2709

Remarque :

<dt>b</dt> –pour texte manuscrit
La description des doctype.xml se trouve dans ce dossier : C:\Users\anais\Desktop\PMB\xampp\xampp\htdocs\pmb\includes\marc_tables\fr_FR

Pareil il faut être attentif à l'existence d'un parent pour les articles, les bulletins

Si on veut faire le text to iso2709 on va dans le fichier params.xml du dossier pmbxml2marciso et on copie colle la balise <step>
Voir dans PMB_explication_convertion c'est expliqué.
reprendre le CSV et le params.xml de l'exemple du fichier de Corse.
Didier Bellamy doit aussi nous fournir les types de champs perso.

Exemple d'import

Définir le mapping entre les champs du CSV et les champs de PMB

Pour les champs les plus communs

  *  Auteur :
	 *  700 = Si 1 Auteur unique 
	 *  701 = Si plusieurs auteurs
	 *  702 = Auteurs secondaires (par ex traducteur ...)
	 *   $a = nom
	 *   $b = prénom
  *  Date publication :
	  *  210 $d = Date de pluli
  *  Titre :
	  *  200 $a = Titre
	  *  200 $i = Titre de série (si monographie)
  *  Numéro :
	  *  200 $h = Numéro dans la série (si monographie)
  *  Page :
	  *  215 $a = Num de page
  *  Mots clefs (utilisation d'un thésaurus) :
	  *  610 $a = Mots clefs libre dans la notice
	  *  676 = Si plan de classement
	  *  606 $a = Si associés à un thésaurus

  *  Site de la zone d'étude :
	  *  610 $a = Mots clefs libre dans la notice
	  *  676 = Si plan de classement
	  *  606 $a = Si associés à un thésaurus
	
  *  Numéro ISBN :
	  *  010 $a = code

  *  ID bd source (= nouveau champ non par défaut dans PMB)
  *  Champs perso de PMB :
	  *  900 $a = <valeur>
	  *  900 $n = <nom>
	  *  900 $l = <libelle>

  *  Cote & licalisation dbiblio :	
	  *  995 $a = localisation 
	  *  995 $f = Num de code barre (ou d'exemplaire) (*)
	  *  995	$k = cote (*)
	  *  995 $q = public visé
	  *  995 $r = Type de document (support) (*)
	  *  995 $u = Commentaire non bloquant
	
(*) = champs obligatoires

Thésaurus

Conversion XSLT

aix2pmbxml permet de traiter des sorties de logiciel superdoc. A l'origine il s'agit d'une sortie xml de Superdoc qui va avoir des tag xml superdoc (particulier).
Type d'entrée=xml
rootelement: inmrecordset

Etapes de transformation: des étapes qui s'enchainent.

La feuille xsl permet de compléter la transformation si certaines choses ne sont pas passées dans le “mapping” traditionnel. C'est du xml qui permet en plus des transformations avec des fonctions.
Cela récupère des balises dans le fichier d'origine et les transforme en autre choses. Cela permet de mettre des conditions pour le mapping (cela prend en compte les valeurs contenues dans les champs).
Par exemple pour mes mots clefs, si les séparateurs sont du ; ou de la , on expose le champs en fonction soit de la virgule soit du point virgule…