Vue normale

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.
À partir d’avant-hierFlux principal

SearXNG – Le métamoteur de recherche open source qui protège votre vie privée

Par : Korben
8 septembre 2024 à 07:00

SearXNG est un métamoteur de recherche open source est un véritable couteau suisse de la recherche en ligne. Imaginez un peu : il agrège les résultats de plusieurs moteurs de recherche comme Google, Bing et DuckDuckGo, mais sans collecter vos données personnelles.

Avec cet outil, vous pouvez dire adieu aux cookies indiscrets et aux trackers qui vous collent à la peau. Ce métamoteur génère un profil de navigateur aléatoire pour chaque requête, rendant votre recherche totalement anonyme et les requêtes sont également envoyées via un serveur proxy pour cacher votre adresse IP.

En plus de protéger votre vie privée, SearXNG vous offre une expérience de recherche personnalisable à souhait. Ainsi, vous pouvez choisir vos moteurs de recherche préférés, ajuster les paramètres de confidentialité et même customiser l’interface. C’est vous le boss !

Sur le site, vous trouverez également d’une liste d’instances publiques que vous pouvez utiliser directement, sans avoir à installer quoi que ce soit mais si vous voulez vraiment avoir le contrôle total, vous pouvez suivre le guide d’installation pour créer votre propre instance privée.

Et rappelez-vous, comme le disait Edward Snowden : « Dire que vous n’avez rien à cacher car vous n’avez rien à vous reprocher, c’est pareil que de dire que vous vous fichez de la liberté d’expression parce que vous n’avez rien à dire.« 

Alors, prêt à faire de SearXNG votre nouveau moteur de recherche ?

LLocalSearch – Le moteur de recherche local basé sur des agents IA

Par : Korben
25 août 2024 à 07:00

LLocalSearch est un moteur de recherche qui fonctionne entièrement en local sur votre machine, qui utilise des agents IA pour effectuer des recherches directement sur votre ordinateur.

Le concept est simple mais diablement efficace. Lorsque vous lui posez une question, le système va enchaîner plusieurs modèles de langage pour trouver la réponse la plus pertinente. Tout le processus est transparent, vous pouvez suivre en temps réel la progression des agents et voir comment ils arrivent à la réponse finale, tout ça sans qu’aucune donnée ne soit envoyée sur des serveurs distants.

Mais il ne se contente pas d’être un simple moteur de recherche en local. Il propose également des fonctionnalités avancées comme la possibilité de poser des questions de suivi pour affiner votre requête initiale. Vous pouvez ainsi avoir un véritable dialogue avec le système pour obtenir exactement l’information dont vous avez besoin.

Un autre atout de LLocalSearch est sa capacité à fonctionner sur du matériel abordable. Pas besoin d’une machine de guerre avec des dizaines de gigaoctets de RAM et une carte graphique dernier cri. Le système est optimisé pour tourner sur des configurations modestes, comme le montre la vidéo de démo qui utilise un modèle de seulement 7 milliards de paramètres.

Côté interface, LLocalSearch mise sur la simplicité et l’efficacité. Que vous utilisiez le système sur ordinateur ou sur mobile, vous bénéficiez d’une interface épurée avec un champ de recherche central et un affichage clair des résultats, le tout avec un joli design soigné qui propose un mode clair et un mode sombre pour s’adapter à vos préférences.

De plus, il est très simple à déployer grâce à Docker. Quelques lignes de commande suffisent pour lancer le système et commencer à l’utiliser.

git clone https://github.com/nilsherzig/LLocalSearch.git
cd ./LLocalSearch
# 🔴 vérifier les variables d'environnement dans le fichier compose (et le fichier `env-example`) et les changer si nécessaire
docker-compose up 

Bien sûr, comme tout projet en phase de démarrage, LLocalSearch n’est pas exempt de bugs et de limitations. Toutes les fonctionnalités prévues ne sont pas encore implémentées et il faudra sans doute un peu de temps avant d’arriver à un système aussi complet et robuste que les moteurs de recherche en ligne que nous connaissons. Mais le potentiel est là et il ne fait aucun doute que ça va rapidement progresser grâce à une communauté open source motivée et passionnée.

En attendant, n’hésitez pas à tester cet outil et à vous faire votre propre idée.

Perplexica – Le moteur de recherche open source propulsé à l’IA

Par : Korben
1 août 2024 à 11:00

Perplexica est un moteur de recherche gratuit et transparent, qui comprend ce que vous lui demandez et qui vous trouve pile poil ce que vous cherchez, le tout boosté à l’intelligence artificielle dernière génération. Ça vous parle, non ?

Ah bah oui c’est comme Perplexity.ai sauf que c’est gratuit, open source et que ça vous permet de fouiller le web en profondeur pour dénicher les réponses à toutes vos questions. Pour cela, l’outil utilise des algorithmes d’apprentissage automatique basés notamment sur la recherche par similarité sémantique. En gros, il est capable de piger le sens de votre question et de trouver les sources les plus pertinentes.

Comme ça, vous obtenez des réponses claires et sourcées, servies sur un plateau d’argent sans avoir besoin de passer des heures à éplucher les pages de résultats pour trouver l’info qui vous intéresse.

Pas de cookies qui vous espionnent ni de revente de données personnelles en douce et vos recherches restent confidentielles. Côté fonctionnalités, Perplexica propose plusieurs modes de recherche bien pratiques :

  • Le mode Copilot (encore en développement) : il génère des requêtes pour trouver les sources Internet les plus pertinentes. Plutôt que d’utiliser uniquement le contexte fourni par SearXNG, il visite directement les meilleurs résultats pour trouver les sources les plus adaptées à votre question.
  • Le mode Normal : il traite votre requête et effectue une recherche web classique.
  • Les Focus Modes : des modes spécialisés pour répondre à des besoins spécifiques, comme la recherche académique, la recherche YouTube, les calculs via Wolfram Alpha ou encore la recherche Reddit pour les discussions et avis.

Et niveau technique, il utilise un meta-moteur de recherche bien fichu qui s’appelle SearXNG. C’est lui qui récupère les résultats, les trie, les recoupe, pour ne garder que la crème de la crème. L’avantage, c’est que vous avez toujours des infos à jour, sans latence. Et comme je le disais en intro, il s’appuie aussi sur des modèles de langage locaux comme Llama3 et Mixtral, via l’API Ollama ce qui lui permet d’affiner encore plus les résultats.

Et pour l’installer, c’est super simple :

  1. Clonez le dépôt GitHub de Perplexica : git clone https://github.com/ItzCrazyKns/Perplexica.git
  2. Renommez le fichier sample.config.toml en config.toml et remplissez les champs nécessaires (clé API, etc.)
  3. Lancez la commande docker compose up -d
  4. Attendez quelques minutes que l’installation se termine
  5. Accédez à Perplexica via http://localhost:31337 depuis votre navigateur

Une fois que c’est en place, vous pouvez même utiliser Perplexica comme moteur de recherche par défaut dans votre navigateur. Il suffit d’aller dans les paramètres, d’ajouter un nouveau moteur de recherche avec l’URL http://localhost:31337/?q=%s et le tour est joué !

Après, forcément, c’est encore un jeune projet, donc il y a des petits trucs à peaufiner et les devs planchent notamment sur la finalisation du mode Copilot, l’ajout d’une page de paramètres, de fonctionnalités comme l’historique de recherche, et le support des modèles de langage locaux.

Mais même en l’état, je trouve que ça vaut grave le coup de tester Perplexica, ne serait-ce que pour voir à quoi peut ressembler un moteur de recherche IA à la fois éthique et transparent ^^.

Remerciement spécial à Lorenper pour l’info !

Hoarder – Tout sauvegarder mais surtout, tout retrouver…

Par : Korben
10 juillet 2024 à 07:00

Vous êtes un accumulateur compulsif de liens intéressants, d’articles à lire plus tard, de notes en vrac et d’images inspirantes ? Ça tombe bien, moi aussi et j’ai trouvé un super outil pour assouvir notre soif de collectionnite aiguë sans nous noyer dans le bordel : Hoarder !

C’est quoi Hoarder ? Et bien c’est une app open source et auto-hébergeable qui permet de sauvegarder en deux clics tout et n’importe quoi : des liens avec prévisualisation automatique, des notes de texte et même des images. Bon OK, je sais, y’a déjà 15000 apps de bookmarking et de prise de notes, alors pourquoi s’emballer pour Hoarder ?

Et bien parce qu’elle coche toutes les cases du cahier des charges de l’accumulateur exigeant :

  • 🔍 Une recherche full-text puissante pour retrouver en deux secondes la perle rare enfouie sous des tonnes de bookmarks.
  • 🏷️ Un étiquetage automatique par IA pour classer et organiser le bordel sans effort. Hoarder analyse le contenu et lui colle des tags pertinents. Magique !
  • 🌙 Un mode sombre (indispensable ^^).
  • 💾 La possibilité de tout héberger soi-même sur son serveur, pour garder le contrôle sur ses données.
  • 📱 Des apps mobiles (en plus du web) pour « hoarder » aussi depuis son smartphone.
  • 🆓 Tout ça gratuitement et avec une bonne tronche bien moderne, merci le design material.

Pour centraliser votre bordel numérique, c’est l’idéal. Vous pourrez sauvegarder tous les articles et threads Twitter intéressants que vous croisez, prendre des notes quand une idée vous traverse l’esprit (un jour peut-être ? ^^) et bien sûr y stocker tous les memes les plus drôles pour les ressortir au bon moment.

Le créateur de Hoarder, Mohamed Bassem, est un ingénieur système qui voulait garder la main dans le dev web tout en se faisant plaisir. Il utilisait Memos, une autre app de prise de notes, mais il lui manquait des features essentielles comme la prévisualisation des liens et le tagging automatique. Plutôt que de râler, il a retroussé ses manches et pondu sa propre solution. Respect.

D’ailleurs, Hoarder s’inspire beaucoup de Mymind, un produit commercial similaire, mais en y ajoutant la dimension auto-hébergement qui est primordiale pour les paranos de la vie privée dont je fais partie. Les alternatives open source comme Shiori ou LinkWarden ne proposent pas (encore) le tagging automatique par IA.

Et sous le capot, ça tourne avec des technos bien sexy comme Next.js, tRPC, Meilisearch et OpenAI.

Pour l’installer, c’est très simple : tout est packagé pour tourner facilement avec Docker et Docker Compose. Il vous faudra aussi une clé d’API OpenAI (pour le tagging) mais c’est optionnel et peu coûteux. Tous les détails sont dans la doc.

Vous pouvez aussi tester une démo en ligne si vous voulez vous faire une idée avant d’installer. Allez, je vous laisse, j’ai un paquet de liens à sauvegarder moi ! 😉

Merci à Lorenper pour l’info !

GPT-4 défie les analystes financiers à leur propre jeu !

Par : Korben
25 mai 2024 à 10:45

Des chercheurs de l’Université de Chicago ont voulu tester les capacités de GPT-4 dans le domaine de l’analyse financière, et pas n’importe quelle analyse hein, ils sont allés directement au cœur du sujet à savoir la prédiction des bénéfices futurs des entreprises à partir de leurs états financiers !

Normalement, c’est un boulot d’expert réservé aux analystes financiers chevronnés, car il faut savoir décortiquer les bilans comptables, calculer des ratios clés, interpréter des tendances… Bref, c’est complexe et les machines n’étaient pas vraiment censées rivaliser avec le flair et l’expérience des pros.

Sauf que… Surprise ! Les résultats de l’étude sont bluffants.

GPT-4, sans aucune formation spécifique, s’est révélé meilleur que la moyenne des analystes humains pour prédire si les bénéfices allaient augmenter ou baisser ! L’IA a même fait jeu égal avec les modèles de machine learning spécialisés, entraînés pendant des heures sur des tonnes de données financières. Pas mal comme performance !

Pour y parvenir, les chercheurs ont préparé des données en anonymisant les états financiers comme ça, pas moyen pour GPT-4 de tricher en allant piocher dans sa mémoire. Il a donc dû se débrouiller comme un grand, en analysant uniquement les chiffres fournis… Il repère les tendances clés, calcule les bons ratios, interprète finement les résultats… bref, il effectue un vrai travail d’analyste !

Les chercheurs ont même montré qu’un réseau de neurones entraîné uniquement sur les commentaires fournis par GPT-4 arrivait à prédire les bénéfices presque aussi bien que l’IA elle-même.

Évidemment, GPT-4 a encore du mal avec les cas tordus, genre les petites boîtes qui font des pertes et les analystes humains gardent un avantage quand ils ont accès à des infos « soft » en plus des chiffres, donc rassurez-vous l’IA ne va pas piquer leur job demain (mais après-demain ?).

N’empêche, ces résultats ouvrent des perspectives plutôt excitantes ! Premièrement, ça pourrait démocratiser l’analyse financière en la rendant accessible au grand public. Deuxièmement, les hedge funds pourraient utiliser GPT-4 pour détecter des opportunités d’investissement.

Les chercheurs ont d’ailleurs testé une stratégie de trading basée sur les prédictions de l’IA, et ça marche plutôt bien ! L’étude montre que la stratégie « long short » basée sur les prédictions de GPT-4 génère des rendements supérieurs au marché, avec des ratios de Sharpe et des alphas significatifs. L’IA semble particulièrement douée pour dénicher de la valeur dans les petites capitalisations, là où les analystes humains et même les réseaux de neurones traditionnels ont plus de mal.

Mais attention, il faut rester prudent. Une IA qui joue en bourse, ça peut être risqué et il va falloir plus de garde-fous. Et puis n’oublions pas que ça reste une étude expérimentale et pas la réalité du terrain.

Mais je trouvais ça assez cool pour vous en parler.

Source

❌
❌