Vue lecture

Sortie de la version 7.0 de Datafari, moteur de recherche open source « intelligent » pour entreprise

Nous (France Labs, éditeur de Datafari) sommes fiers de vous annoncer la mise à disposition de Datafari 7.0

Nous avons beaucoup travaillé sur l’intégration plus avancée de l’IA au moment de la recherche, avec à présent une interface dédiée, notre « assistant intelligent », qui permet de converser avec les documents internes.

Pour rappel, Datafari est une solution de recherche pour entreprise. Où que les connaissances se trouvent et sous quelque format que ce soit, elle permet aux employés de retrouver les données utiles.

Et désormais grâce à l’IA, de « discuter » avec ses connaissances. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre aussi de chercher des documents, mais aussi d’utiliser une IA générative pour les questionner.

Pour cette dépêche, on se concentre sur la version libre et open source (licence Apache Public License v2).

Exemple de l'assistant IA Datafari

Les nouveautés et changements principaux par rapport à la version 6 :

  1. Un assistant intelligent permettant de discuter avec les documents
  2. Un mode « Retrieval Augmented Generation » permettant d’obtenir des réponses basées uniquement sur les données internes, et ne nécessitant pas d’entraîner un modèle
  3. Un mode « agentic » permettant à l’IA de raisonner sur la question posée, et de décider quelles actions prendre pour y répondre
  4. Une recherche avec plusieurs modes : par mots clés, sémantique (basée sur la recherche vectorielle dans Solr) ou hybride
  5. Des corrections, des améliorations et des mises à jour logicielles

Comment démarrer ?

Pour voir à quoi ça ressemble, nous avons téléversé une courte vidéo de démonstration (voir le lien plus bas). Pour démarrer tout de suite, le mieux est d’aller lire le quick start guide. Nous mettons gratuitement à disposition notre documentation Datafari sur Confluence, qui couvre les usages, l’administration et le développement. Attention, les modules d’IA que nous avons développés, nécessitent la disponibilité d’un serveur exposant un modèle d’IA compatible. De base, Datafari n’héberge pas localement une IA. Le plus simple pour débuter est de le connecter par exemple à Mistral pour se faire la main, et ensuite de passer à des modèles locaux hébergés par vos soins ou par des partenaires.

Pour rappel, voici les principales fonctionnalités de Datafari en tant que moteur de recherche :

Que peut-on faire avec Datafari ?

Datafari est un moteur de recherche pour entreprise enrichi à l’IA : membres de la famille des outils de gestion des connaissances, les solutions de recherche fédèrent les connaissances en analysant et indexant tous les documents d’une organisation, aussi bien leur contenu que leurs métadonnées. Pour cela, le moteur de recherche doit être multi‐sources, multi‐formats, et gérer la sécurité. En outre, il faut permettre l’administration de l’outil.

Dans la version libre, on peut, côté admin :

  1. Administrer les connecteurs vers les sources de données (nous utilisons Apache ManifoldCF avec tous ses connecteurs) ;
  2. Utiliser l’IA à l’indexation pour analyser et enrichir les contenus ;
  3. Gérer l’algorithme de pertinence qui classe les documents pour leur affichage suite à une requête ;
  4. Mettre en avant des documents pour des requêtes identifiées ;
  5. Créer des utilisateurs et leur assigner des rôles ;
  6. Voir des statistiques d’usage de l’outil ;
  7. Configurer le modèle d’IA et les paramètres de vectorisation ;
  8. Encore plein d’autres choses abordées dans la documentation Confluence.

Côté utilisateur, on peut :

  1. Chercher de façon simple ou avancée ;
  2. Poser des questions sur un ou plusieurs documents ;
  3. Laisser l’IA fouiller dans tous les documents pour répondre ;
  4. Bénéficier de la correction orthographique et de l’auto‐complétion ;
  5. Choisir et utiliser des facettes pour filtrer les résultats ;
  6. Créer des alertes par courriel quand des documents modifiés ou nouveaux correspondent à une requête ;
  7. ….

Et ensuite ?

Pour 2026 et 2027, nous continuerons de faire évoluer la partie IA. En parallèle, nous travaillons à la refonte de notre système de moissonnage des données.

Des commentaires ?

Nous sommes en permanence à l’écoute des commentaires et suggestions pour faire avancer le produit, alors profitez-en, que ce soit d’un point de vue technique ou fonctionnel, ça nous intéresse. Ha et si vous êtes déjà un utilisateur, n’hésitez pas à en parler sur le web !

Commentaires : voir le flux Atom ouvrir dans le navigateur

  •  

Electrical Current Might Be the Key To a Better Cup of Coffee

An anonymous reader quotes a report from Ars Technica: University of Oregon chemist Christopher Hendon loves his coffee -- so much so that studying all the factors that go into creating the perfect cuppa constitutes a significant area of research for him. His latest project: discovering a novel means of measuring the flavor profile of coffee simply by sending an electrical current through a sample beverage. The results appear in a new paper published in the journal Nature Communications. [...] The coffee industry typically uses a method for measuring the refractive index of coffee -- i.e., how light bends as it travels through the liquid -- to determine strength, but it doesn't capture the contribution of roast color to the overall flavor profile. So for this latest study, Hendon decided to focus on roast color and beverage strength, the two variables most likely to affect the sensory profile of the final cuppa. His solution turned out to be quite simple. Hendon repurposed an electrochemical tool called a potentiostat, typically used to test battery and fuel cell performance. Hendon used the tool to measure how electricity interacted with the liquid. He found that this provided a better measurement of the flavor profile. He even tested it on four different samples of coffee beans and successfully identified the distinctive signature of a batch that had failed the roaster's quality-control process. Granted, one's taste in coffee is fairly subjective, so Hendon's goal was not to achieve a "perfect" cup but to give baristas a simple tool to consistently reproduce flavor profiles more tailored to a given customer's taste. "It's an objective way to make a statement about what people like in a cup of coffee," said Hendon. "The reason you have an enjoyable cup of coffee is almost certainly that you have selected a coffee of a particular roast color and extracted it to a desired strength. Until now, we haven't been able to separate those variables. Now we can diagnose what gives rise to that delicious cup." Outside of his latest electrical-current experiment, Christopher Hendon's coffee research has shown that espresso can be made more consistently by modeling extraction yield -- how much coffee dissolves into the final drink -- and controlling water flow and pressure. He also found that static electricity from grinding causes fine coffee particles to clump, which disrupts brewing. The solution: adding a small squirt of water to beans before grinding (known as the Ross droplet technique) to reduce that static, cut clumping and waste, and lead to a stronger, more consistent espresso.

Read more of this story at Slashdot.

  •  
❌