[Ossm-members] Amit Skenderi Romska Lokalizacija

Дамјан penguinista at mail.net.mk
Tue Jul 4 14:32:42 UTC 2006


> Kako sto razgovaravme 

ја изгледа нешто сум out of the loop.. :)

[јас ги имам правено locale-то и тастатурата за македонски јазик во Linux 
(конзола и X) така да можам да помогнам околу тоа - не е многу тешко но има 
трикови]

> I mi kazavte da najdam nesto vo vrska so Romskiot 
> jazik, jas uspeav da najdam mnogu jasna info na wikipedina I toa na
> sledniov link
>
> http://en.wikipedia.org/wiki/Romany_language
>
> Pa mislam deka e nesto sto kazuva uspeh za lokalizacijata ?

Генерално за локализација ти требаат три компоненти:
1) locale
2) тастатура
3) превод на програмите

1) Locale
locale е збир на правила во врска со јазикот И земјата.
Така на пример имаш pt_PT (португалски во Португалија) и pt_BR (португалски во 
Бразил) или de_DE, de_BE, de_AT, de_CH, de_LU или пак en_US, en_GB, en_AU 
итн...
Кратенките за јазиците се дефинирани со iso639, за ромски колку гледам е 
rom(2). Имињата на земјите се дефинирани во ISO 3166 (3).

Најважно прашање за ромски locale ќе биде, дали постои било каков официјален 
правопис или сличен документ? Пошто ако не постои, ќе имаш проблем од типот: 
различни ставови по одредени прашања без можност да се повикаш на некој 
авторитетен и точен извор. Али ако само тебе те интересира темава, може нема 
да имаш спротивставени мислења (ја така го направив mk_MK) :))

Locale-то дефинира:
- множеството на знаци/букви во јазикот (денеска за сите јазици се користи 
utf-8)
- начинот на сортирање на знаци/букви во јазикот (има unicode стандард кој е 
во ред за повеќето јазици, но кај некои јазици има отстапки унгарски на 
пример). 
 ... Ќе треба да обезбедиш фајл со сите букви од јазикот, сортирани според 
правилниот редослед за да видиме дали unicode стандарадот задоволува...
- правила за прикажување на времиња и датуми. Ќе требаат имињата на месеците и 
деновите во неделата (и скратена форма од по три букви). 
Еве што има во македонското locale:
abday="нед;пон;вто;сре;чет;пет;саб"
day="недела;понеделник;вторник;среда;четврток;петок;сабота"
abmon="јан;фев;мар;апр;мај;јун;јул;авг;сеп;окт;ное;дек"
mon="јануари;февруари;март;април;мај;јуни;јули;август;септември;октомври;ноември;декември"
d_t_fmt="%a, %d %b %Y %T %Z"
date_fmt="%a, %d %b %H:%M:%S %Z %Y"
d_fmt="%d.%m.%Y"
- правила за прикажување на бројките, на пример во македонскиот јазик илјада 
петсто триесет и шест запирка дваесет и три, се пишува 1 536,23 (значи се 
групираат по три букви, децималите се одвојуваат со запирка, иљадарките со 
празно).
- правила за прикажување на пари, ова во rom_MK ќе биде исто со mk_MK
.. има уште некои детали во locale-то ама не се толку битни...


2) Тастатура
Неам појма како би требало да изгледа ромска тастатура. Кои букви надвор од 
латиницата ги има во ромскиот јазик? Има ли документ кој го дефинира тоа? 
Каде на тастатурата би се ставиле extra буквите... Во македонскиот случај не 
беше многу тешко - кирилицата има 5 букви повеќе од латиницата кои се ставени 
десно од буквите, а лево од enter-от значи место :
[ ] ; ' \ 
соодветно:
ш ѓ ч ќ ж
Други специфики се: q -> љ, w -> њ, x -> џ и y -> ѕ.
И специјалните „е“ и „и“ со надреден знак кои се добиваат со комбинација на 
знакот `  и соодветната буква. И за ќеф со shift-2 и shift-3 се добиваат 
наводници според македонски правопис „ “.
Мислам дека дури и постои некој стандард за тастатурата според МАНУ, ама оваа 
во Linux е правена според старите YUSCII фонтови и можеби update-увана според 
таа во Windows98.
Значи ова треба да се смисли како ќе изгледа, и да ги имаш unicode (4) 
кодовите за секоја буква, па ќе ја средиме работата.

3) Преводи
Откога ќе ги решиме горниве работи, ти требаат уште луѓе со желба и почнувате 
да преведувате... за тоа ... отом-потом.

Предлагам понатамошната дискусија да се концентрира на поединечни теми во 
посебни mail-ови, за да не се промаши некоја корисна информација. Прочитај го 
ова па кажи кој дел не ти е јасен да разјаснам.


Ресурси:
(1)
http://en.wikipedia.org/wiki/Internationalization_and_localization

(2) iso639
http://www.loc.gov/standards/iso639-2/langcodes.html#qr

(3) ISO 3166 
http://www.iso.ch/iso/en/prods-services/iso3166ma/02iso-3166-code-lists/index.html

(4) Unicode табели
http://www.unicode.org/charts/


-- 
дамјан ( http://softver.org.mk/damjan/ )

               I believe the technical term is "Oops!"



More information about the Ossm-members mailing list