Humatheque Pipeline POC

Image de page de titre -> extraction VLM -> vérification Sudoc -> alignement IdRef -> classification Dewey -> brouillon bibliographique.

Type de document
Fournisseur d'inférence

Clés API via variables d'environnement : OPENAI_API_KEY (OpenAI), HF_TOKEN (Hugging Face), ALBERT_API_KEY (Albert API). Le VLM on-premise ne requiert pas de clé.

256 2048