Regex ve D RegexMatch'den Veri Alma[Sorun]

Jun 18, 2014

huseyin

Jun 19, 2014

Ali Çehreli (acehreli)

Jun 19, 2014

huseyin

Jun 19, 2014

Ali Çehreli (acehreli)

Jun 19, 2014

Jun 19, 2014

Jun 21, 2014

Jun 22, 2014

June 18, 2014

Regex ve D RegexMatch'den Veri Alma[Sorun]

Posted by huseyin

Permalink

huseyin

Permalink

Merhaba Arkadaşlar
D ile bir regex çalışması yaparken şöyle bir sorunla karşılaştım.

string text=cast(string)std.file.read("a.txt");
auto titlereg=regex(`<td[^>]*\sclass="alt1Active"[^>]*>\s*<div>\s*<a[^>]*><strong>(.*?)<\/strong><\/a>`);//title için

auto titles=matchAll(text,titlereg);

   foreach(title;titles)
   {
       writeln(title);
       writeln();

   }

Böyle yazdırınca Çıktı:

["<td class="alt1Active" id="f11" align="left"> <a href="ali">KONU", "KONU"]

["<td class="alt1Active" id="f12" align="left"> <a href="veli">SORU", "SORU"]

["<td class="alt1Active" id="f13" align="left"> <a href="huseyin">YORUM", "YORUM"]

Benim istediğim 2. olan. İlk dizi olduğunu düşünerek opIndex ile çekmeyi denedim yani title[1] gibi ancak değilmiş.
RegexMatch adında bir yapı.
*struct RegexMatch(R, alias Engine = ThompsonMatcher) if (isSomeString!R); *

Teşekkürler

--
[ Bu gönderi, http://ddili.org/forum'dan dönüştürülmüştür. ]

import std.stdio; import std.regex; void main() { string text = "<td class=\"alt1Active\" id=\"f11\" align=\"left\"> <div> <a href=\"ali\"><strong>KONU</strong></a>"; auto titlereg=regex(`<td[^>]*\sclass="alt1Active"[^>]*>\s*<div>\s*<a[^>]*><strong>(.*?)<\/strong><\/a>`);//title için auto titles=matchAll(text,titlereg); foreach(title;titles) { writeln(title[1]); } }

Alıntı (huseyin:1403349915):

Alıntı (Mengu:1403244242):

selamlar huseyin

regex ile html parse etmemek lazim. vakit gectikce insan bunu daha iyi anliyor. html bir tree oldugu icin html parser kullanmak cok daha mantikli. fakat is ufak, pek de karsi ciktigim bir sey degil boyle basit taskler icin.

Selamlar
Regex'i html ayırmak için kullanmam php ile başlamıştı :) Aslında çok problem olmuyor regex üzerinden devam edebilirim. Evet DOM parser aradım ancak bulamamıştım. Kütüphane için çok teşekkür ederim.

İlk xml ile denedim ki html in yapısı bozuk olduğunda program hata döndürüyor falan bir sürü hikaye

evet xml parserlar eger html desteklemiyorlarsa direkt patlar kimi html dokumanlari icin. well-formed html dokumanlar icin patlamama ihtimalleri olsa da dom parser kullanmak daha dogru.

--
[ Bu gönderi, http://ddili.org/forum'dan dönüştürülmüştür. ]

Forums

Böyle yazdırınca Çıktı:

["<td class="alt1Active" id="f13" align="left"> <a href="huseyin">YORUM", "YORUM"]