Humatheque Pipeline POC

Image de page de titre -> extraction VLM -> vérification Sudoc -> alignement IdRef -> classification Dewey -> brouillon bibliographique.

Type de document
Fournisseur d'inférence

Clés API via variables d'environnement : OPENAI_API_KEY (OpenAI), HF_TOKEN (Hugging Face et LIFT), ALBERT_API_KEY (Albert API). Le VLM on-premise ne requiert pas de clé. LIFT impose son propre prompt à schéma JSON strict, sélectionné automatiquement.

256 2048