Dizgi sıralamalarında bazı karakterlerin sonraya bırakılması gerekiyor. Örneğin "atın" ve "at'ın" öncelikle kesme karakterine bakılmaksızın aynı kabul edilmeli, kesme karakterine en sonunda ikincisini daha sonra yapacak şekilde bakılmalı.
Bir arkadaş, kesme karakterinden başka karakterlerin de öyle kullanılmaları gerektiğini söyledi. Onun C kütüphanesinde şöyle bir işlev varmış:
inline bool is_apostroph(
wchar_t c)
{
if(c == L'\'' || c == RIGHT_SINGLE_QUOTATION_MARK ||
c == RIGHT_DOUBLE_QUOTATION_MARK || c == '\"') {
return(true);
}
return(false);
}
Ayrıca, Unicode'da tanımlı şu karakterler de varmış:
BYTE bIgnore; /* The ignore char; word break.*/
BYTE bIgnoreNonBreaking; /* The ignore char; non word break.*/
BYTE bHyphenSoft; /* Syllable hyphen char. */
BYTE bHyphenNonBreaking; /* Non-breaking hyphen. */
BYTE bEmDash; /* Em Dash. */
BYTE bEnDash; /* En Dash. */
Bunları trileri'ye de eklemek gerek diye unutmayalım diye yazdım.
Ali
--
[ Bu gönderi, http://ddili.org/forum'dan dönüştürülmüştür. ]