Je vous propose aujourd'hui une méthode pour agréger (c'est- à-dire fusionner) des flux RSS de différentes sources et d'y appliquer un critère de filtrage afin de n'obtenir que du contenu sur un sujet donné.
Les flux RSS
Un flux RSS est un fichier mis à jour régulièrement, par un site, qui permet à l’aide d’un lecteur d’être en permanence au courant des derniers articles disponibles sur ce site.
Ces flux sont, le plus généralement, sous forme d'un fichier XML . ils sont accessibles via une URL comme https://www.francetvinfo.fr/foot.rss (il s'agit ici du flux "foot" de franceinfo ).
Voici un exemple de structure d'un fichier
Code : Tout sélectionner
<item>
<title>VIDEO. Covid-19 : "Les cantines scolaires restent ouvertes, ce n'est pas la même chose qu'un bar", dit Jean-Michel Blanquer</title>
<link>https://www.francetvinfo.fr/sante/maladie/coronavirus/video-covid-19-les-cantines-scolaires-restent-ouvertes-ce-n-est-pas-la-meme-chose-qu-un-bar-dit-jean-michel-blanquer_4117935.html#xtor=RSS-3-[sante]</link>
<description> Le ministre de l'Education nationale veut croire qu'"on ne se contamine pas plus en allant à l'école qu'en vivant d'autres aspects de la vie sociale".</description>
<enclosure url="https://www.francetvinfo.fr/image/75s6d8d8u-8daa/500/281/22222821.jpg" length="24826" type="image/jpeg"/>
<pubDate>Fri, 25 Sep 2020 08:12:51 GMT</pubDate>
<guid isPermaLink="false">https://www.francetvinfo.fr/sante/maladie/coronavirus/video-covid-19-les-cantines-scolaires-restent-ouvertes-ce-n-est-pas-la-meme-chose-qu-un-bar-dit-jean-michel-blanquer_4117935.html#xtor=RSS-3-[sante]</guid>
<dc:date>2020-09-25T08:12:51Z</dc:date>
</item>
- soit par les logiciels spécialisés https://framalibre.org/tags/rss ,
- soit par les navigateurs web du marché (avec ou sans une extension spécifique sur le cas)
- Pour Firefox https://addons.mozilla.org/fr/firefox/a ... ent=search
- Pour Edge (Microsoft) https://microsoftedge.microsoft.com/add ... /rss?hl=fr
- Pour Chrome(Google) https://chrome.google.com/webstore/deta ... bfjd?hl=fr
- Pour Opéra le lecteur est intégré en natif
Une fois que nos navigateurs sont prêts, on se lance ... Mais vu les différents flux disponibles, on peut être vite tenté de n'avoir qu'un flux par thématique regroupant plusieurs sources ...
On va devoir utiliser un outil d'agrégation afin de fusionner ces flux entre eux et de ne former qu'une seule source.
Nos sources pour un aficionado des sports d'équipe et de formule 1 :
- Un flux sur le foot https://www.francetvinfo.fr/foot.rss
- Un flux sur le rugby https://www.francetvinfo.fr/rugby.rss
- Un flux sur la formule 1 https://www.francetvinfo.fr/f1.rss
Une fois que vous avez saisi les URL et cliquez sur create, vous obtenez un lien http://www.rssmix.com/u/12261807/rss.xml
Si vous l'utilisez directement, vous allez avoir énormément d'informations qui vont remonter => on peut être alors tenté de filtrer ce flux
Filtrer un flux RSS
Ce qui suit s'applique aussi bien à un flux "simple" qu'à un flux agrégé
Nous allons utiliser un outil gratuit en ligne pour trier les informations présentes dans le flux ... Il s'agit de https://siftrss.com/
- Saisissez l'url du flux
- Définissez le critère de filtrage
- Validez => vous obtenez une nouvelle URL qui ne contient que les nouvelles correspondant aux critères de tri
- Mercedes dans le titre : https://siftrss.com/f/vb7PZMG3jmL
- Ligue 1 dans le titre https://siftrss.com/f/9Bpqv3dKPy
- Cliquez sur l'URL pour lire vos nouvelles
Sources : Google, Framasoft,