Naprej Nazaj Kazalo

4. Posebni (specifični) programi

4.1 Programi za delo z omrežjem

telnet

V nekaterih namestitvah telnet privzeto ni nastavljen na 8-bitni prenos. Da bi lahko poslali znake iz nabora Unicode oddaljenemu računalniku, morate najprej nastaviti telnet na način "outbinary". Za to sta dve možnosti:

$ telnet -L <host>
in
$ telnet
telnet> set outbinary
telnet> open <host>

kermit

Komunikacijski program C-Kermit ( http://www.columbia.edu/kermit/ckermit.html), (interaktivno orodje za nastavljanje povezave, telnet, prenos datotek, s podporo TCP/IP in zaporednim povezavam) v različici 7.0 ali novejši pozna kodiranji UTF-8 in UCS-2 za prenos podatkov, prav tako pozna tudi terminalsko kodiranje po UTF-8. Zna tudi pretvarjati v obe kodiranji in še v številna druga. Dokumentacijo za te značilnosti najdete na http://www.columbia.edu/kermit/ckermit2.html#x6.6.

4.2 Brskalniki

Netscape

Netscape 4.05 ali novejši lahko prikaže dokumente HTML, ki so kodirani po UTF-8. V dokumentu mora med oznakama <head> in </head> stati tudi:

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

Netscape 4.05 ali novejši lahko prikaže tudi dokumente in tekstovne datoteke, kodirane po UCS-2, z oznako o vrstnem redu zlogov.

Netscapova domača stran je: http://www.netscape.com/computing/download/.

Mozilla

V Mozilla milestone M16 je internacionalizacija rešena precej bolje kakor v Netscape 4. Prikaže lahko dokumente HTML, kodirane po UTF-8, s podporo več jezikom. Zato pa ima manjšo lepotno napako pri pisavah CJK. Nekateri simboli so lahko večji od višine vrstice, tako da prekrijejo prejšnjo ali naslednjo vrstico.

Mozillina domača stran je: http://www.mozilla.org/.

Lynx

Lynx-2.8 ima zaslon z možnostmi (tipka 'O'), na katerem se lahko nastavi nabor znakov za prikaz. Ko poganjate Lynx v xtermu ali konzoli v načinu UTF-8, nastavite to na "UNICODE UTF-8". Da začne ta nastavitev delovati v trenutnem teku brskalnika, jo morate potrditi v polju "Accept Changes" (sprejmi spremembe), da bo delovala vedno, pa morate izbrati polje "Save options to disk" (shrani možnosti na disk) in to potrditi s poljem "Accept Changes".

Tudi tokrat mora v dokumentu med oznakama <head> and </head> stati:

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

Pri prikazovanju tekstovnih datotek, kodiranih po UTF-8, morate v ukazni vrstici podati možnost "-assume_local_charset=UTF-8" (deluje samo pri naslovih, ki se začnejo s 'file:/') ali "-assume_charset=UTF-8" (deluje pri vseh vrstah naslovov). V Lynxu 2.8.2 lahko tudi na zaslonu z možnostmi (tipka 'O') spremenite predpostavljeni nabor znakov v "utf-8".

Na zaslonu z možnostmi je tudi možnost, da nastavite svoj "naljubši nabor znakov v dokumentu" (angl. preferred document character set). Vendar to ne deluje, če se URL začne s 'file:/...' ali s 'http://...' in je na strežniški strani Apache 1.3.0.

Problem je tudi s presledki in prelomom vrstic. Oglejte si razdelek o ruščini v x-utf8.html ali v utf-8-demo.txt.

Če je Lynx 2.8.2 nastavljen z --enable-prettysrc, barvna shema ne deluje več pravilno, ko nabor znakov na zaslonu nastavite na "UNICODE UTF-8". To popravite s preprostim popravkom lynx282.diff.

Razvijalci Lynxa pravijo: "Za vsako resno uporabo z izhodom na zaslon po UTF-8 se še vedno priporoča prevajanje s knjižnico slang in -DSLANG_MBCS_HACK."

Zadnja stabilna različica: ftp://ftp.gnu.org/pub/gnu/lynx/lynx-2.8.2.tar.gz

Izvirno kodo Lynxa dobite na: http://lynx.isc.org/.

Splošna domača stran: http://lynx.browser.org/

Novejše različice, ki jih še razvijajo: http://lynx.isc.org/current/, ftp://lynx.isc.org/current/

W3M

W3m avtorja Akinorija Ita

( http://ei5nazha.yz.yamagata-u.ac.jp/~aito/w3m/eng/) je tekstovni brskalnik po straneh HTML. Njegov prikaz tabel, naštevanj ipd. v HTML je precej lepši kot v Lynxu. Uporaben je tudi kot zelo dober pretvornik iz HTML v besedilo.

W3m ima izbire iz ukazne vrstice za tri najpomembnejša japonska kodiranja, lahko pa ga uporabite tudi za datoteke, ki so kodirane po UTF-8. Če v ukazni vrstici ne vnesete nobene izbire, morate pogosto pritiskati Ctrl-L za osveževanje prikaza, prelom vrstic v odstavkih v cirilici in v CJK pa ni dober.

To odpravite s popravkom Hironorija Sakamota ( http://www2u.biglobe.ne.jp/~hsaka/w3m/), ki med kodiranja za prikaz doda UTF-8.

Strani za preizkušanje

Nekaj strani za preizkus brskalnikov najdete na straneh Alana Wooda ( http://www.hclrss.demon.co.uk/unicode/#links) in Jamesa Kassa ( http://home.att.net/~jameskass/).

4.3 Urejevalniki

Yudit

Yudit avtorja Gáspárja Sinaia ( http://czyborra.com/yudit/ in http://www.yudit.org) je prvovrsten urejevalnik besedil, kodiranih po Unicode, za sistem X Window. Podpira hkratno obdelavo pri več jezikih, načinih vnosa in pretvorbah za krajevne standarde znakov. Ima pripomočke za vnašanje besedila v vseh jezikih z angleško tipkovnico, pri čemer se uporabljajo nastavitve za razporeditve tipk.

Prevesti ga je mogoče v treh različicah: Xlib GUI, KDE GUI ali Motif GUI.

Prilagoditi si ga je zelo lahko. Ponavadi si najprej prilagodite pisavo tako, da z menuja pisave (angl. font) izberete "Unicode". Nato izberete pisavo velikosti 13 (pri ukazu "xlsfonts '*-*-iso10646-1'" tu in tam še vedno nastane zmešnjava), ki se ujema s 13-točkovno pisavo stalne širine Markusa Kuhna.

Zatem si prilagodite način vnosa. Najbolj značilni so "Straight", "Unicode" in "SGML". Podrobnosti o drugih vgrajenih načinih vnosa najdete v /usr/local/share/yudit/data/.

Da bi postala sprememba privzeta ob vseh nadaljnjih zagonih programa, vnesite želene spremembe v datoteko $HOME/.yuditrc.

Splošne zmožnosti urejevalnika so omejene na urejanje, 'rezanje & lepljenje' (angl. cut & paste) ter iskanje & nadomeščanje. Možnosti razveljavitve (angl. undo) ni.

Yudit lahko prikaže besedilo z uporabo pisave truetype, oglejte si razdelek "Pisave truetype". Dobre rezultate da tudi pisava Bitstream Cyberbit. Da bi jo Yudit lahko našel, naredite povezavo nanjo na /usr/local/share/yudit/data/cyberbit.ttf.

Vim

Vim (pri različici 6.0b) dobro podpira UTF-8: ko ga poženete v UTF-8 locale, privzame kodiranje UTF-8 za konzolo in za tekstovne datoteke, ki jih urejate. Podpira znake z dvojno širino (npr. CJK) pa tudi kombiniranje znakov in se zato odlično prilega v Xterm z omogočenim UTF-8.

Namestitev: z naslova http://www.vim.org/ si naložite izvirno kodo. Ko odpakirate vse štiri dele, popravite datoteko src/Makefile tako, da bo vključeno tudi stikalo --with-features=big. Tako boste vključili značilnosti FEAT_MBYTE, FEAT_RIGHTLEFT in FEAT_LANGMAP. Zatem poženite "make" in "make install".

Emacs

Najprej si preberite razdelek o podpori mednarodnim naborom znakov (angl. "International Character Set Support") v priročniku za Emacs. Še posebej upoštevajte, da morate pognati Emacs z ukazom

$ emacs -fn fontset-standard
, da se bo uporabila pisava s precej mednarodnimi znaki.

Na kratko povedano, paketa za uporabo UTF-8 v Emacsu sta dva. Pri nobenem izmed njiju vam Emacsa ni treba še enkrat prevajati.

Uporabljate lahko kateregakoli izmed njiju, lahko tudi oba skupaj. Prednosti kodiranja po "unicode-utf8" (paket emacs-utf) sta, da se naloži hitreje in da se bolje obnese pri kombiniranju znakov (to je pomembno pri tajščini). Prednost kodiranja po "utf-8" (paket Mule-UCS/oc-unicode) pa je, da lahko tudi obdeluje medpomnilnik (kot npr. M-x shell) in ne samo nalaga in shranjuje datoteke. Prav tako bolje obravnava širino znakov (pomembno pri etiopščini). Zato pa je manj zanesljivo: po obsežnem urejanju datoteke se lahko zgodi, da se po shranjevanju datoteke nekateri znaki iz Unicode nadomestijo z U+FFFD.

Da bi namestili paket emacs-utf, najprej prevedite program "utf2mule" in ga namestite v enega izmed imenikov, ki so našteti v spremenljivki PATH. Nekam namestite tudi unicode.el, muleuni-1.el in unicode-char.el. Nato v datoteko $HOME/.emacs dodajte vrstice:

(setq load-path (cons "/home/user/somewhere/emacs" load-path))
(if (not (string-match "XEmacs" emacs-version))
  (progn
    (require 'unicode)
    ;(setq unicode-data-path "..../UnicodeData-3.0.0.txt")
    (if (eq window-system 'x)
      (progn
        (setq fontset12
          (create-fontset-from-fontset-spec
            "-misc-fixed-medium-r-normal-*-12-*-*-*-*-*-fontset-standard"))
        (setq fontset13
          (create-fontset-from-fontset-spec
            "-misc-fixed-medium-r-normal-*-13-*-*-*-*-*-fontset-standard"))
        (setq fontset14
          (create-fontset-from-fontset-spec
            "-misc-fixed-medium-r-normal-*-14-*-*-*-*-*-fontset-standard"))
        (setq fontset15
          (create-fontset-from-fontset-spec
            "-misc-fixed-medium-r-normal-*-15-*-*-*-*-*-fontset-standard"))
        (setq fontset16
          (create-fontset-from-fontset-spec
            "-misc-fixed-medium-r-normal-*-16-*-*-*-*-*-fontset-standard"))
        (setq fontset18
          (create-fontset-from-fontset-spec
            "-misc-fixed-medium-r-normal-*-18-*-*-*-*-*-fontset-standard"))
       ; (set-default-font fontset15)
        ))))
Katerikoli nabor pisav lahko sprožite prek menuja Mule - Set Font/Fontset ali s kombinacijo Shift - dol - miška - 1. Trenutno so v Unicode najbolje pokrite pisave z višino 15 in 13, predvsem po zaslugi pisav 9x15 in 6x13 Markusa Kuhna. Da bo nabor pisav postal začetni nabor pisav za prvo okno ob zagonu, odkomentirajte vrstico set-default-font v zgornjih nastavitvah Emacsa.

Za namestitev paketa oc-unicode vnesite ukaz

$ emacs -batch -l oc-comp.el
in namestite nekam tako nastale datoteke un-define.elc pa tudi oc-unicode.el, oc-charsets.el in oc-tools.el. Nato v datoteko $HOME/.emacs dodajte vrstice:
(setq load-path (cons "/home/user/somewhere/emacs" load-path))
(if (not (string-match "XEmacs" emacs-version))
  (progn
    (require 'oc-unicode)
    ;(setq unicode-data-path "..../UnicodeData-3.0.0.txt")
    (if (eq window-system 'x)
      (progn
        (setq fontset12
          (oc-create-fontset
            "-misc-fixed-medium-r-normal-*-12-*-*-*-*-*-fontset-standard"
            "-misc-fixed-medium-r-normal-ja-12-*-iso10646-*"))
        (setq fontset13
          (oc-create-fontset
            "-misc-fixed-medium-r-normal-*-13-*-*-*-*-*-fontset-standard"
            "-misc-fixed-medium-r-normal-ja-13-*-iso10646-*"))
        (setq fontset14
          (oc-create-fontset
            "-misc-fixed-medium-r-normal-*-14-*-*-*-*-*-fontset-standard"
            "-misc-fixed-medium-r-normal-ja-14-*-iso10646-*"))
        (setq fontset15
          (oc-create-fontset
            "-misc-fixed-medium-r-normal-*-15-*-*-*-*-*-fontset-standard"
            "-misc-fixed-medium-r-normal-ja-15-*-iso10646-*"))
        (setq fontset16
          (oc-create-fontset
            "-misc-fixed-medium-r-normal-*-16-*-*-*-*-*-fontset-standard"
            "-misc-fixed-medium-r-normal-ja-16-*-iso10646-*"))
        (setq fontset18
          (oc-create-fontset
            "-misc-fixed-medium-r-normal-*-18-*-*-*-*-*-fontset-standard"
            "-misc-fixed-medium-r-normal-ja-18-*-iso10646-*"))
       ; (set-default-font fontset15)
        ))))
Ustrezen nabor pisav si nastavite enako kot pri paketu emacs-utf.

Da boste lahko naložili datoteko, kodirano v UTF-8, vtipkajte

M-x universal-coding-system-argument unicode-utf8 RET
M-x find-file datoteka RET
ali
C-x RET c unicode-utf8 RET
C-x C-f datoteka RET
(oz. utf-8 namesto unicode-utf8, če imate rajši oc-unicode/Mule-UCS).

Lupinsko okno z vhodom in izhodom v UTF-8 odprete, če vtipkate:

M-x universal-coding-system-argument utf-8 RET
M-x shell RET
(To deluje samo z oc-unicode/Mule-UCS.)

Upoštevajte, da vse to deluje samo z Emacsom v okenskem načinu, ne pa tudi v terminalskem.

Richard Stallman načrtuje, da bo dolgoročno dodal v Emacs integrirano podporo UTF-8. Podobno načrtuje tudi skupina razvijalcev XEmacsa.

Xemacs

(Ta razdelek je napisal Gilbert Baumann.)

XEmacs (različica 20.4 nastavljena z MULE) si lahko prilagodite na UTF-8 takole. Žal boste potrebovali izvirno kodo, da boste lahko vnesli popravke.

Najprej potrebujete naslednji datoteki, ki ju je prispeval Tomohiko Morioka:

http://turnbull.sk.tsukuba.ac.jp/Tools/XEmacs/xemacs-21.0-b55-emc-b55-ucs.diff in http://turnbull.sk.tsukuba.ac.jp/Tools/XEmacs/xemacs-ucs-conv-0.1.tar.gz.

Končnica .diff se nanaša na izvirnik v jeziku C. V paketih tar je koda v elispu, ki omogoča precej kodnih tabel za prenose v Unicode in iz njega. Kot je razvidno iz imena datoteke .diff, se nanaša na XEmacs-21. Treba je bilo nekaj 'popravkov'. Najopaznejša razlika v izvirniku za XEmacs 20.4 je, da se je file-coding.[ch] preimenoval v mule-coding.[ch].

Nekaj hitrih napotkov za vse, ki se podobno kakor avtor ne spoznajo preveč na XEmacs-MULE:

To, kar se imenuje kodiranje (angl. encoding), se v MULE imenuje 'coding-system'. Najpomembnejša ukaza sta:

M-x set-file-coding-system
M-x set-buffer-process-coding-system   [comint buffers]

in spremenljivka `file-coding-system-alist', ki ukazu `find-file' pomaga uganiti uporabljeni način kodiranja. Ko zadevo poženete, morate najprej storiti tole.

Ta koda preveri posebno vrstico z načinom, ki se začne z -*- nekje med prvimi 600 zlogi datoteke, ki jo nameravate odpreti. Če se tam prikaže polje "Encoding: xyz;" in kodiranje 'xyz' obstaja, ga izberite. Zdaj lahko npr. storite

;;; -*- Mode: Lisp; Syntax: Common-Lisp; Package: CLEX; Encoding: utf-8; -*-

in XEmacs se preklopi v način utf.

Ko ste vse pognali, lahko definirate \u03BB (grška lambda) kot makro:

(defmacro \u03BB (x) `(lambda .,x))

Nedit

Xedit

Če imate XFree86-4.0.1, lahko z Xeditom urejate datoteke, kodirane po UTF-8, če ste ustrezno nastavili locale (glejte zgoraj) in dodali vrstico "Xedit*international: true" v datoteko $HOME/.Xdefaults.

Axe

V različici 6.1.2 Axe podpira samo 8-bitne locale. Če v $HOME/.Xdefaults dodaste vrstico "Axe*international: true", se bo preprosto 'sesul'.

Pico

Mined98

Mined98 ( http://www.inf.fu-berlin.de/~wolff/mined.html) je preprost urejevalnik avtorjev Michiela Huisjesa, Achima Müllerja in Thomasa Wolffa. V xtermu, ki podpira UTF-8 ali druga 8-bitna kodiranja, vam omogoča urejanje datotek, ki so kodirane po UTF-8 ali drugem 8-bitnem standardu. Zelo dobro tudi omogoča vnašanje znakov iz nabora Unicode.

Mined vam omogoča urejanje 8-bitno kodiranih in po UTF-8 kodiranih datotek. Privzeto uporabi hevristično samozaznavo. Če se nočete zanašati na hevristiko, v ukazni vrstici podajte stikalo -u, kadar urejate datoteko po UTF-8, ali +u, kadar urejate 8-bitno kodirano datoteko. To lahko kadarkoli spremenite znotraj urejevalnika. V vrstici z menujem se prikaže kodiranje z "L:h" za 8-bitna kodiranja in "U:h" za UTF-8. Kliknite prvega izmed teh znakov, če želite to spremeniti.

Mined pozna znake z dvojno širino ter kombinirane znake in jih tudi pravilno prikaže.

Ima tudi lepo organizirane padajoče menuje, zato pa tipke, kot so Home, End ali Delete, ne delujejo.

4.4 Programi za elektronsko pošto

MIME: RFC 2279 definira UTF-8 kot nabor znakov MIME, ki se lahko prenaša pod 8-bitnimi kodiranji ter kodiranjema 'quoted-printable' in base64. Za starejši predlog MIME UTF-7 (RFC 2152) velja, da je v zatonu, zato naj se ga ne bi več uporabljalo.

Poštni odjemalci, ki so izšli po 1. januarju 1999, bi morali znati pošiljati in prikazovati po UTF-8 kodirana sporočila, sicer se upoštevajo kot neustrezni. Toda ta sporočila morajo nositi oznako MIME

Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
Enostavno pošiljanje datoteke, kodirane po UTF-8, po cevi v "mail" brez popravka oznak MIME ne bo uspešno.

Programerji odjemalcev za elektronsko pošto bi si morali ogledati strani http://www.imc.org/imc-intl/ in http://www.imc.org/mail-i18n.html.

Zdaj pa k posameznim poštnim odjemalcem (oz. "agentom za uporabo el. pošte"):

Pine

Stanje za nepopravljeni Pine različice 4.10 je naslednje.

Pine ne pretvarja naborov znakov. Omogoča pa vam, da si ogledate po UTF-8 kodirana sporočila v tekstovnem oknu, ki ima nastavljen UTF-8 (konzola za Linux ali xterm).

Ponavadi vas bo Pine opozoril na drug nabor znakov vsakič, ko gledate sporočilo, kodirano po UTF-8. Teh opozoril se znebite, če izberete S (setup), zatem C (config), nato pa "character-set" nastavite na UTF-8. Tako ne boste storili nič posebnega, le opozoril ne bo več, saj v Pine ni vgrajenega nobenega znanja o UTF-8.

Upoštevajte tudi, da je pri Pinu koncept znakov iz Unicode precej omejen. Prikazal bo znake v latinici in grške znake, preostalih znakov pa ne.

Popravek Roberta Bradyja (el. pošta: rwb197@ecs.soton.ac.uk, nahajališče popravka: http://www.ents.susu.soton.ac.uk/~robert/pine-utf8-0.1.diff) doda Pinu podporo UTF-8. S tem popravkom se zaglavja in telesa dekodirajo in prikažejo pravilno. Popravek je odvisen od knjižnice libunicode ( http://cvs.gnome.org/lxr/source/libunicode/) za GNOME.

Kljub vsemu poravnava ne deluje povsod pravilno, pri odgovarjanju se nabor znakov ne pretvori ustrezno, urejevalnik Pico pa sploh ne zna delati z večzložnimi znaki.

Kmail

Kmail (različica, ki se distribuira s KDE 1.0) sploh ne podpira UTF-8.

Netscape Communicator

Messenger (del Netscape Communicatorja) zna pošiljati in prikazati sporočila, ki so kodirana po UTF-8, vendar je treba tudi nekaj malega ročnega posredovanja.

Pošiljanje sporočil, kodiranih po UTF-8: ko odprete okno za sestavljanje sporočila (Compose), morate, še preden začnete pisati sporočilo, z menuja izbrati "View -> Character Set -> Unicode (UTF-8)". Potem lahko napišete sporočilo in ga odpošljete.

Ko prejmete tako kodirano sporočilo, ga Netscape žal ne bo takoj prikazal v pravem naboru znakov, niti vam ne bo tega vidno nakazal. Z menuja morate ročno izbrati "View -> Character Set -> Unicode (UTF-8)". Nato izberite kategorijo pisav Unicode.

Emacs (Rmail, Vm)

Mutt

Mutt-1.0, ki ga dobite na naslovu http://www.mutt.org/, ima zelo omejeno podporo UTF-8. Za polno podporo je Edmund Grimley Evans naredil popravke, ki jih dobite na naslovu http://www.rano.demon.co.uk/mutt.html.

Exmh

Exmh 2.1.2 s Tk 8.4a1 prepozna in pravilno prikaže sporočila, kodirana po UTF-8 (vendar brez znakov CJK), če v datoteko $HOME/.Xdefaults dodaste naslednje vrstice:

!
! Exmh
!
exmh.mimeUCharsets:                     utf-8
exmh.mime_utf-8_registry:               iso10646
exmh.mime_utf-8_encoding:               1
exmh.mime_utf-8_plain_families:         fixed
exmh.mime_utf-8_fixed_families:         fixed
exmh.mime_utf-8_proportional_families:  fixed
exmh.mime_utf-8_title_families:         fixed

4.5 Obdelava besedil

Groff

Groff 1.16, izvedba GNU tradicionalnega sistema troff/nroff za obdelavo besedil v Unixih, lahko na izhodu doda oblikovano besedilo z znaki po UTF-8. Namesto 'groff -Tlatin1' ali 'groff -Tascii' enostavno vtipkajte 'groff -Tutf8'.

TeX

Distribucije TeTeX 0.9 in novejše imajo prilagoditev Texa za Unicode, ki se imenuje Omega ( http://www.gutenberg.eu.org/omega/, ftp://ftp.ens.fr/pub/tex/yannis/omega). Skupaj z datoteko unicode.tex, ki je v utf8-tex-0.1.tar.gz, vam omogoča, da kot vhod v TeX vnesete izvirnike, kodirane po UTF-8. Trenutno je podprtih na tisoče znakov iz Unicode.

Spremeni se le to, da poženete `omega' (namesto `tex') ali `lambda' (namesto `latex') in v glavo vašega izvirnika vrinete naslednje vrstice:

\ocp\TexUTF=inutf8
\InputTranslation currentfile \TexUTF
\input unicode

Verjetno sta tej tematiki posvečeni tudi naslednji povezavi: http://www.dante.de/projekte/nts/NTS-FAQ.html in ftp://ftp.dante.de/pub/tex/language/chinese/CJK/.

4.6 Zbirke podatkov

PostgreSQL

PostgreSQL 6.4 ali novejši zgradite z naslednjo možnostjo nastavitve: --with-mb=UNICODE.

4.7 Drugi programi v tekstovnem načinu

Less

S programom Less, ki se ga dobi na naslovu http://www.flash.net/~marknu/less/less-358.tar.gz, lahko brskate po tekstovnih datotekah, ki so kodirane po UTF-8, če konzola ali xterm podpirata tako kodiranje. Preverite, da spremenljivka okolja LESSCHARSET ni nastavljena (ali da je nastavljena na utf-8). Če je nastavljena tudi spremenljivka LESSKEY, preverite, ali datoteka, na katero kaže, ne definira spremenljivke LESSCHARSET. Če je treba, naredite to datoteko še enkrat z ukazom `lesskey' ali pa spremenljivko LESSKEY "prekličite".

Lv

Lv-4.21 ( http://www.mt.cs.keio.ac.jp/person/narita/lv/) avtorja Tomia Narite je pregledovalnik datotek z vgrajenim pretvornikom naborov znakov. Če želite v konzoli, podprti z UTF-8, pregledati datoteke, kodirane po UTF-8, vtipkajte "lv -Au8". Lahko pa ga uporabite tudi za pregledovanje po drugih kodiranjih CJK kodiranih datotek v konzoli s podporo UTF-8.

Program ima tudi drobno napakico: kazalec (kurzor) v xtermu izgine in se po koncu ne pokaže znova.

Expand, Wc

Priskrbite si GNU textutils-2.0 in uporabite popravek textutils-2.0.diff, nato si prilagodite nastavitve in v config.h dodajte vrstice "#define HAVE_MBRTOWC 1", "#define HAVE_FGETWC 1" in "#define HAVE_FPUTWC 1". V datoteki src/Makefile popravite CFLAGS in LDFLAGS tako, da zajemata tudi imenike, v katerih je nameščen libutf8. Zatem prevedite vse skupaj.

Col, Colcrt, Colrm, Column, Rev in Ul

Priskrbite si paket util-linux-2.9y, ga nastavite in zatem v datoteki defines.h definirajte ENABLE_WIDECHAR. V datoteki lib/widechar.h "#if 0" popravite v "if 1". V datoteki text-utils/Makefile popravite CFLAGS in LDFLAGS tako, da zajemata imenike, v katerih je nameščen libutf8. Prevedite vse skupaj.

Figlet

Figlet 2.2 ima stikalo za vnos po UTF-8: "figlet -C utf8"

Temeljni pripomočki

Seznam ukazov in pripomočkov Li18nux, ki bi moral biti povezljiv z UTF-8, je še vedno nepopoln in potrebuje še precej koristnih informacij. Avtorju jih še ni uspelo zbrati :-).

Pri glibc-2.2 bodo delovali le regularni izrazi z 8-bitnimi znaki. Pri locale za UTF-8 regularni izrazi, ki obsegajo ne-ASCII znake ali v katerih naj bi primerjali posamezne večzložne znake s ".", ne bodo delovali. Posledice tega se bodo poznale v vseh ukazih in pripomočkih, ki so našteti spodaj.

alias

Na voljo ni še nobenih informacij

ar

Na voljo ni še nobenih informacij

arch

Na voljo ni še nobenih informacij

arp

Na voljo ni še nobenih informacij

asa

Na voljo ni še nobenih informacij

at

Pri at-3.1.8 sta dve uporabi isalnum v at.c neveljavni in ju je treba nadomestiti z uporabo quotearg.c ali s seznamom za izključevanje seznamov metaznakov iz lupine. Dve uporabi %8s v at.c in atd.c sta neveljavni in ju je treba popraviti na poljubno dolžino.

basename

Kot pri sh-utils-2.0i: vse je v redu.

batch

Na voljo ni še nobenih informacij

bc

Na voljo ni še nobenih informacij

bg

Na voljo ni še nobenih informacij

bunzip2

Na voljo ni še nobenih informacij

bzip2

Na voljo ni še nobenih informacij

bzip2recover

Na voljo ni še nobenih informacij

cal

Na voljo ni še nobenih informacij

cat

Na voljo ni še nobenih informacij

cd

Na voljo ni še nobenih informacij

cflow

Na voljo ni še nobenih informacij

chgrp

Kot pri fileutils-4.0u: vse v redu

chmod

Kot pri fileutils-4.0u: vse v redu

chown

Kot pri fileutils-4.0u: vse v redu

chroot

Kot pri sh-utils-2.0i: vse v redu

cksum

Kot pri textutils-2.0e: vse vredu

clear

Na voljo ni še nobenih informacij

cmp

Na voljo ni še nobenih informacij

col

Na voljo ni še nobenih informacij

comm

Na voljo ni še nobenih informacij

command

Na voljo ni še nobenih informacij

compress

Na voljo ni še nobenih informacij

cp

Kot pri fileutils-4.0u: vse v redu

cpio

Na voljo ni še nobenih informacij

csplit

Na voljo ni še nobenih informacij

ctags

Na voljo ni še nobenih informacij

crontab

Na voljo ni še nobenih informacij

cut

Na voljo ni še nobenih informacij

date

Kot pri sh-utils-2.0i: vse v redu

dd

Kot pri fileutils-4.0u: stikali conv=lcase in conv=ucase ne delujeta pravilno

depmod

Na voljo ni še nobenih informacij

df

Kot pri fileutils-4.0u: vse v redu

diff

Kot pri diffutils-2.7 (1994): diff se ne zaveda nastavitev locale, način --side-by-side zato ne izračuna pravilno širine stolpca, to velja celo za locale, ki temeljijo na ISO-8859-1

diff3

Na voljo ni še nobenih informacij

dirname

Kot pri sh-utils-2.0i: vse v redu

domainname

Na voljo ni še nobenih informacij

du

Kot pri fileutils-4.0u: vse v redu

echo

Kot pri sh-utils-2.0i: vse v redu

env

Kot pri sh-utils-2.0i: vse v redu

expand

Na voljo ni še nobenih informacij

expr

Kot pri sh-utils-2.0i: operatorji "match", "substr", "index" in "length" ne delujejo pravilno

false

Kot pri sh-utils-2.0i: vse v redu

fc

Na voljo ni še nobenih informacij

fg

Na voljo ni še nobenih informacij

file

Na voljo ni še nobenih informacij

find

Kot pri findutils-4.1.5: stikalo "-ok" še ne pozna mednarodnih nastavitev, popravek je že bil posredovan vzdrževalcu. Stikalo "-iregex" ne deluje pravilno, potreben je popravek v funkciji find/parser.c:insert_regex

fort77

Na voljo ni še nobenih informacij

ftp[BSD]

Na voljo ni še nobenih informacij

fuser

Na voljo ni še nobenih informacij

getconf

Na voljo ni še nobenih informacij

getopts

Na voljo ni še nobenih informacij

gunzip

Na voljo ni še nobenih informacij

gzip

Gzip je zmožen uporabljati UTF-8, vendar uporablja le angleška sporočila v naboru ASCII. Pri pravilni prilagoditvi bi bilo treba: uporabiti gettext, klicati setlocale. V funkciji check_ofname (datoteka gzip.c) namesto spraševanja vrste da/ne uporabite funkcijo rpmatch. Uporaba funkcije strlen v gzip.c:852 je napačna, treba je uporabiti funkcijo mbswidth.

hash

Na voljo ni še nobenih informacij

head

Na voljo ni še nobenih informacij

hostname

Kot pri sh-utils-2.0i: vse v redu

id

Kot pri sh-utils-2.0i: vse v redu

ifconfig

Na voljo ni še nobenih informacij

imake

Na voljo ni še nobenih informacij

insmod

Na voljo ni še nobenih informacij

ipchains

Na voljo ni še nobenih informacij

ipcrm

Na voljo ni še nobenih informacij

ipcs

Na voljo ni še nobenih informacij

ipmasqadm

Na voljo ni še nobenih informacij

jobs

Na voljo ni še nobenih informacij

join

Na voljo ni še nobenih informacij

kerneld

Na voljo ni še nobenih informacij

kill

Na voljo ni še nobenih informacij

killall

Na voljo ni še nobenih informacij

ksyms

Na voljo ni še nobenih informacij

ldd

Na voljo ni še nobenih informacij

less

Na voljo še ni popolnih informacij

lex

Na voljo ni še nobenih informacij

lilo

Na voljo ni še nobenih informacij

ln

Kot pri fileutils-4.0u: vse v redu

loadkeys

Na voljo ni še nobenih informacij

logger

Na voljo ni še nobenih informacij

Logname

Kot pri sh-utils-2.0i: vse v redu

lp

Na voljo ni še nobenih informacij

lpc[BSD]

Na voljo ni še nobenih informacij

lpr[BSD]

Na voljo ni še nobenih informacij

lprm[BSD]

Na voljo ni še nobenih informacij

lpq[BSD]

Na voljo ni še nobenih informacij

ls

Kot pri fileutils-4.oy: vse v redu

lsmod

Na voljo ni še nobenih informacij

m4

Na voljo ni še nobenih informacij

mailx

Na voljo ni še nobenih informacij

make

Na voljo ni še nobenih informacij

mesg

Na voljo ni še nobenih informacij

mkdir

Kot pri fileutils-4.0u: vse v redu

mkfifo

Kot pri fileutils-4.0u: vse v redu

mkfs

Na voljo ni še nobenih informacij

mkswap

Na voljo ni še nobenih informacij

modprobe

Na voljo ni še nobenih informacij

more

Na voljo ni še nobenih informacij

mount

Na voljo ni še nobenih informacij

mv

Kot pri fileutils-4.0u: vse v redu

netstat

Na voljo ni še nobenih informacij

newgrp

Na voljo ni še nobenih informacij

nice

Kot pri sh-utils-2.0i: vse v redu

nl

Na voljo ni še nobenih informacij

nohup

Kot pri sh-utils-2.0i: vse v redu

nslookup

Na voljo ni še nobenih informacij

nm

Na voljo ni še nobenih informacij

od

Na voljo ni še nobenih informacij

passwd[BSD]

Na voljo ni še nobenih informacij

paste

Na voljo ni še nobenih informacij

patch

Na voljo ni še nobenih informacij

pathchk

Kot pri sh-utils-2.0i: vse v redu

ping

Na voljo ni še nobenih informacij

printf

Kot pri sh-utils-2.0i: vse v redu

pr

Na voljo ni še nobenih informacij

ps

Na voljo ni še nobenih informacij

pwd

Kot pri sh-utils-2.0i: vse v redu

read

Na voljo ni še nobenih informacij

rdev

Na voljo ni še nobenih informacij

reboot

Na voljo ni še nobenih informacij

renice

Na voljo ni še nobenih informacij

rm

Kot pri fileutils-4.0u: vse v redu

rmdir

Kot pri fileutils-4.0u: vse v redu

rmmod

Na voljo ni še nobenih informacij

shar[BSD]

Na voljo ni še nobenih informacij

shutdown

Na voljo ni še nobenih informacij

sleep

Kot pri sh-utils-2.0i: vse v redu

split

Na voljo ni še nobenih informacij

strings

Na voljo ni še nobenih informacij

strip

Na voljo ni še nobenih informacij

stty

Kot pri sh-utils-2.o1: niza "<undef>" se ne bi smelo prevajati, potreben je popravek v funkciji stty.c:visible.

su[BSD]

Na voljo ni še nobenih informacij

sum

Kot pri textutils-2.0e: vse v redu

tac

Na voljo ni še nobenih informacij

tail

Na voljo ni še nobenih informacij

talk

Na voljo ni še nobenih informacij

tar

Kot pri tar-1.13.17: v redu, če sta imeni uporabnika in skupine vedno zapisani v ASCII

tclsh

Na voljo ni še nobenih informacij

tee

Kot pri Sh-utils-2.0i: vse v redu

telnet

Na voljo ni še nobenih informacij

test

Kot pri sh-utils-2.0i: vse v redu

time

Na voljo ni še nobenih informacij

touch

Kot pri fileutils-4.0u: vse v redu

tput

Na voljo ni še nobenih informacij

tr

Na voljo ni še nobenih informacij

true

Kot pri Sh-utils-2.0i: vse v redu

tsort

Na voljo ni še nobenih informacij

tty

Kot pri sh-utils-2.0i: vse v redu

type

Na voljo ni še nobenih informacij

ulimit

Na voljo ni še nobenih informacij

umask

Na voljo ni še nobenih informacij

umount

Na voljo ni še nobenih informacij

unalias

Na voljo ni še nobenih informacij

uname

Kot pri sh-utils-2.0i: vse v redu

uncompress

Na voljo ni še nobenih informacij

unexpand

Na voljo ni še nobenih informacij

uniq

Na voljo ni še nobenih informacij

unlink

Na voljo ni še nobenih informacij

uudecode

Na voljo ni še nobenih informacij

uuencode

Na voljo ni še nobenih informacij

wait

Na voljo ni še nobenih informacij

wc

Kot pri textutils-2.oe: wc ne more prešteti znakov, popravek je že posredovan vzdrževalcu

who

Kot pri sh-utils-2.0i: vse v redu

wish

Na voljo ni še nobenih informacij

write

Na voljo ni še nobenih informacij

xargs

Kot pri findutils-4.1.5: program uporabi strstr, popravek je že posredovan vzdrževalcu

yacc

Na voljo ni še nobenih informacij

zcat

Na voljo ni še nobenih informacij

4.8 Preostali programi za X11

Owen Taylor trenutno razvija knjižnico pango za prikaz večjezičnih besedil. Več o tem na http://www.labs.redhat.com/~otaylor/pango/ in http://www.pango.org/.


Naprej Nazaj Kazalo