Feed43 - převeďte si jakoukoliv stránku na RSS

Překvapuje mě, kolik webů nemá v dnešní době RSS výstup. Naštěstí je tu ale webová služba Feed43, se kterou si můžete vytvořit RSS pro jakoukoliv stránku. Ukážeme si krátký návod, jak na to.

Obrázek článku

Nejprve je nutné provést jednoduchou registraci a potvrdit e-mail. Po přihlášení klikněte na odkaz My Feeds a po té na Create New Feed.

1. Zadejte adresu a kódování stránky

Step 1. Specify source page address (URL) 

  • Address: URL adresa webu (např. http://blog.rotten77.cz/)
  • Encoding: kódování web (zjistíte z META)
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />; 
  • Klikněte na tlačítko Reload a načte se vám HTML kód stránky

2. Definice pravidel

Step 2. Define extraction rules

Definujeme pravidla, které nám z obsahu stránky vytáhnou pouze to, co potřebujeme.

  • Globální (Global Search Pattern) - slouží pro získávání obsahu z jedné položky (např. článku na úvodní stránce webu)
  • Položky (Item (repeatable) Search Pattern) - jak už z názvu vyplívá, jedná se o získání dat z opakovaných položek, to znamená například výpis článků apod.

Jak definovat pravidla?

Pravidla definujeme pomocí HTML a zástupných znaků:

  • {*} - různý obsah, který nás nezajímá, ale pomůže nám při hledání
  • {%} - obsah, který chceme získat

Ukážu příklad z tohoto blogu. Když se podíváte na zdrojový kód, zjistíte, že se články vypisují takto:

<h2 class="post"><a="" href="./url-clanku">Název článku</a></h2> 
<p class="anotace">Anotace článku</p> 
<p class="textC"><img src="./userfiles/obrazek.jpg" alt="Obrázek článku" title="Název článku" /></p> 
<p>Obsah článku</p>
<p class="info">Napsal: Jan Zatloukal @ Datum, čas<br />
Štítky: <a href="./stitek/url-stitku">název štítku</a>
<br />Komentáře: <a href="./url-clanku#komentare">komentáře (0)</a></p> 
<hr /> 

Položky vyznačené tučně jsou ty, které chceme získat, tedy Název článku, odkaz na článek a anotaci. Pravidla proto definujeme takto:

{*}<h2 class="post"><a href="{%}">{%}</a></h2>{*}<p class="anotace">{%}</p>{*}

Pomocí znaku {*} jsme odstranili přebytečné údaje a pomocí {*} zase vytáhli ty důležité.

  • Klikněte na tlačítko Extract - vyskočí vám pole Clipped Data, ve kterém budou vypsány jednotlivé údaje, společně s jejich pořadovým číslem ({%1}, {%2}, ...)
Feed43: Definice pravidel
Feed43: Definice pravidel

3. Definujeme výstup

Step 3. Define output format

Tady použijeme vyextrahované údaje ({%1}, {%2}, ...) pro vytvoření RSS:

Feed43: Vyextrahované údaje
Feed43: Vyextrahované údaje

  • Nastavení feedu (RSS feed properties)
    • Feed Title - název feedu (např. blog rotten77)
    • Feed Link - odkaz feedu (např. http://blog.rotten77.cz/)
    • Feed Description - popis feedu (např. blog kytaristy rottena)
  • Nastavení položek (RSS item properties)
    • Item Title Template - název položky (v našem případě {%2})
    • Item Link Template - odkaz na položku ({%1})
    • Item Content Template - obsah položky ({%3}) - sem můžete přidávat další HTML značky
  • Klikneme na tlačítko Preview a objeví se nám náhled a odkaz na RSS feed.
    (http://feed43.com/8675182432064107.xml)
Feed43: Nastavení položek a náhled RSS feedu
Feed43: Nastavení položek a náhled RSS feedu

Třeba se vám tato služba bude v budoucnu hodit, mě už se v několika případech dobře osvědčila a ušetřila mi spoustu času.

Feed43 najdete na adrese http://feed43.com/.

Napsal: Jan Zatloukal @ 25. 02. 2010, 20:29
Štítky: web


  • Nenechávejte si to pro sebe:
  • Twitter
  • Facebook
  • Linkuj
  • Delicious
  • Google Buzz

Komentáře (3) »

gravatar
Karel K. 25.02.2010, 21:29 Odpovědět

Díky za tip! Tohle jsem hledal už sakramentsky dlouho! Vynikající nápad, služba i Váš popis.

 
gravatar
rotten77 26.02.2010, 08:52 Odpovědět

Díky, trochu jsem se obával, že to z toho nikdo nepochopí :-)

 

Přidat komentář

Vložit příspěvek

Gravatar