Date: Mon, 24 Nov 1997 01:01:59 -0500 (EST) From: Vlado Keselj To: ST-L Subject: ST-L: standardi:slovni vs. neslovni Content-Type: TEXT/PLAIN; charset=US-ASCII Po"sto se diskusija na listi, imaju'ci u vidu nekih stotinjak zadnjih poruka, tj. zadnjih par dana, dotakla jedne interesantne teme -- ,,(ne)slovnosti'' standarda zapisivanja -- pomislih da ukle"sem par crtica (klinastim pismom, jakako): Par definicija (nestrogih, tj. aljakvih): _Engleska slova_ su a..z i A..Z (26+26=52 slova). _Na"sa slova_ su engleska slova - {q,w,y,x,Q,W,Y,X} + {"c, 'c, d"z, dj, lj, nj, "s, "z, "C, 'C, D"z, Dj, Lj, Nj, "S, "Z} (52-8+16 = 60 slova, kao "sto i o"cekujemo). _Pro"sireni skup na"sih slova_ je: na"sa slova + {D"Z, LJ, NJ} (mo"zda zbunjuju'ce, ali potrebno zbog jednozna"cnosti latini"cnog zapisa; 60+3 = 63 slova). _Slova_ je skup koji je unija na"sih slova (ostavimo neodredjeno pitanje da li je skup pro"siren ili ne) i engleskih slova (60(63) + 8 = 68(71)). Standard je _slovan_ ako se bilo koja niska sastavljena od slova zapisuje niskom koja je sastavljena od engleskih slova. Tako, na primjer, borin, qwyx (ako ga dobro potrefih) i tanjug su slovni jer se ,,kala"stura'' pi"se niskama engleskih slova: kalasxtura, kalawtura, i kalasstura; slikovni, bq i v o"cigledno nisu: kala^stura, kala`stura i kala"stura. Slovnost je sigurno vrlina standarda: Raznorazni gotovi programi za engleski jezik 'ce da pravilno rade: wc, pro"catnici (spell checker-i), mo"zemo da koristimo na"se identifikatore u programskim jezicima (nazive promjenljivih, funkcija itd.), dajemo datotekama razumljivija imena, razni ,,pametni'' programi nam se ne'ce petljati u ono "sto pi"semo (ubacivanjem razmaka na pogre"sna mjesta, upozoravanjem na nepostoje'ce gre"ske itd.)... ("Cak, ako "zelimo da posmatramo tekst kao niz rije"ci, ne upu"staju'ci se u aktivnost "citanja, onda je i estetski dojam sigurno bolji kod slovnih standarda.) Dakle, pitanje je: Ako nam zatreba slovni standard, koji da se koristi? Zaboravimo na jednozna"cnost, na momenat. Dyq (qwyx) bi, navodno, trebalo da bude dobar kandidat jer mu je zapis kra'ci od drugih. Medjutim, za"sto nam treba kra'ci zapis? Sigurno ne zbog toga da bi u"stedili stotinu-dvije bajtova memorije, koji se ionako ne u"stede zbog raznoraznih poravnanja (alignments) u primarnoj i sekundarnim memorijama. U"steda u kucanju? Dankov ra"cun prije nekog vremena je pokazao da je u"steda u broju otkucaja zanemariva. Pri svemu tome nije ni uzeto u obzir da kuca"c kuca i razne druge znakove osim slova (interpunkcijske znake, razmake, novi red, pa onda povratnike (backspace) itd.). Osim toga, ako revolucija utopista (CTP*PA) ne uspije, kuca"cu ostaje da se zamara neintuitivnim standardom. Dalje, u ra"cunu nije uzeto u obzir da se x i y lak"se kucaju od q i w, "sto ide u prilog borinom standardu (dualu); da ne govorim o tanjugu, u kome je duplo kucanje jednog znaka gotovo ravno jednom kucanju po utro"senom vremenu i ulo"zenom trudu. Zbog intuitivnosti i foneti"cnosti, mislim da je borin (dual) najprihvatljiviji slovni standard. Osim toga, abecedno uredjivnje (sortiranje) u njemu je naj"ce"s'ce identi"cno sa na"sim standardnim abecednim uredjenjem. To je ipak vrlina (iako ovo ,,naj"ce"s'ce'' je "cesto dobro koliko i ,,nikad''). A sada bolna ta"cka: jednozna"cnost. Qwyx uop"ste nije jednozna"can i to mu je fatalna mana sa moje ta"cke gledi"sta. Ovo je zgodno mjesto da se iskoristi ovo novo ime: qwyx je nejednozna"cni dyq, dok dyq ostaje jednozna"cni dyq. Usput, dyq nije slovni standard po"sto se podvlaka (_, underscore) mo"ze pojaviti u zapisu rije"ci. Nije ni borin, "sto ne valja. Po"sto autor standarda nije dao pravila koja bi omogu'cila jednozna"cno zapisivanje u borinom (dualu), predla"zem jednozna"cnu verziju borin1, tj. dual1: Ru"zno pravilo (dato na primjerima): cxx => c + x, nyy => n + y, ... Tako, na primjer, re"cenica ,,"Cemu slu"zi registar CX?'' bi se u borinom1 pisala: Cxemu sluzxi registar CXX? Ovih par novina (qwyx/dyq i borin1/duql1) je aktuelizirano (a"zurirano) u donjoj tabeli, a doda'cu ih u unistd prvom prilikom. --vk /-----------------------------------------------------------------------\ | s | | | | | | | q | | | | | l | A | | C | | S | | y | | | P | | i | s | | R Y | T | R | b | r | * | | O | | k | k | q | O U | A | P | o d | y | q | | S | | o | e | d w | S | N | S | r u | l | u | v | T | | v | t | y y | C | J | C | i a | y | o | | V | | n | o | q x | I | U | I | n l | x | t | | | | i | v | | I | G | I | (1) | | e | | | |-----------------------------------------------------------------------| | c~ | cz | q | } | ch | } | cy | q | *k | 'c | c' | | c^ | ch | y | ~ | cc | ~ | cx | y | *c | "c | c" | | s^ | sh | w | { | ss | { | sx | w | *s | "s | s" | | z^ | zh | x | ` | zz | ` | zx | x | *z | "z | z" | | d~ | dj | dq | | | dd | | | dy | dq | *g | dj | dj | | C~ | Cz | Q | ] | CH | ] | Cy | Q | *K | 'C | C' | | C^ | Ch | Y | ^ | CC | ^ | Cx | Y | *C | "C | C" | | S^ | Sh | W | [ | SS | [ | Sx | W | *S | "S | S" | | Z^ | Zh | X | @ | ZZ | @ | Zx | X | *Z | "Z | Z" | | D~ | Dj | Dq | \ | DD | \ | Dy | Dq | *G | DJ | DJ | | nj | nj | nj | nj | nj | w | ny | nq | *n | nj | nj | | Nj | Nj | Nj | Nj | NJ | W | Ny | Nq | *N | Nj | Nj | | lj | lj | lj | lj | lj | q | ly | lq | *l | lj | lj | | Lj | Lj | Lj | Lj | LJ | Q | Ly | Lq | *L | Lj | Lj | | dz^ | dzh | dx | d` | dzz| x | dx | dy | *d | d"z | dz" | | Dz^ | Dzh | Dx | D` | DZZ| X | Dx | Dy | *D | D"z | Dz" | |-----------------------------------------------------------------------| Napomena: Na mjestu *, predlozeni su obrnuti apostrof: ` (= backquote standard ili bq), x (= xquote standard ili xq), te q (qquote standard ili qq) Dopunska pravila za jednoznacan zapis proizvoljne niske: dyq (koji je jednozna"can, za razliku od qwyx-a): ------------------------------------------------- (1) Ne prevodi se sve wto se nalazi _izmedqu dva underscorea_, sami underscorei se briwu, tj. ne prenose u izlazni tekst: Pr.: Dowao sam u _New York_. --> Do"sao sam u New York. (2) Dva underscorea zapravo ozna"cavaju jedan koji nije aktivan u smislu (1). *quote ili *q: -------------- Znak * (tj. `, x ili q) se zapisuje uduplava`nem, tj.: ** => * borin1 (dual1) (borin (dual) nisu jednozna"cni): ------------------------------------------------ Znak x ili y se poduplava, na primjer: CXX => C + X nyy => n + y v: -- Kombinacije se razbijaju kori"s'cenjem znaka \, kao na primjer: d\j => d + j D\"z => D + "z D"\z => D + " + z d\\j => d + \ + j "\\\z => " + \ + \ + z itd.