Linux-Bulgaria.ORG
навигация

 

начало

пощенски списък

архив на групата

семинари ...

документи

как да ...

 

 

Предишно писмо Следващо писмо Предишно по тема Следващо по тема По Дата По тема (thread)

Re: [SOLUTION] Re: lug-bg: utf,ansi,unicode etc...


  • Subject: Re: [SOLUTION] Re: lug-bg: utf,ansi,unicode etc...
  • From: Alexander Shopov <al_shopov_lug@xxxxxxxxx>
  • Date: Mon, 11 Aug 2003 18:08:59 +0300


Predpolagam che ako se naprawi syshtoto nesto za BG text, ste otgatwa po dobre bg-encoding... ama dokolkoto znam nqma podobni na word-"corpusi" za bulgarski ezik... (i nie sme cheli malko za linguisics :") )

Ako "corpus-a" e dostatychno golqm i da obhwashta poweche oblasti naisitna move da ima 99.98% tochnost..
Хм. Мисля, че сайтът Словото е нахакал достатъчно български текст за подобен анализ ;-) Общо взето - имат множество текстове от български писатели. Речта ни фонетично/буквено не се различава толкова много от тяхната (като изключим да речем Паисиевата история и Житието Софрониево *в оригинал* ;->, осъвременените варианти са ОК ) Лексикално може би този корпус издиша, но за буквено/фонетичен анализ мисля, че е супер. Просто wget и пускай статистиката да се генерира.
ал_шопов


============================================================================
A mail-list of Linux Users Group - Bulgaria (bulgarian linuxers).
http://www.linux-bulgaria.org - Hosted by Internet Group Ltd. - Stara Zagora
To unsubscribe: http://www.linux-bulgaria.org/public/mail_list.html
============================================================================



 

наши приятели

 

линукс за българи
http://linux-bg.org

FSA-BG
http://fsa-bg.org

OpenFest
http://openfest.org

FreeBSD BG
http://bg-freebsd.org

KDE-BG
http://kde.fsa-bg.org/

Gnome-BG
http://gnome.cult.bg/

проект OpenFMI
http://openfmi.net

NetField Forum
http://netField.ludost.net/forum/

 

 

Linux-Bulgaria.ORG

Mailing list messages are © Copyright their authors.