Re: Getallen

View: New views
2 Messages — Rating Filter:   Alert me  

Parent Message unknown Re: Getallen

by Bart Knubben :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Dag Ruud,

Het lijkt me een begin van een elegante oplossing. Bij deze wat bevindingen.

Hunspell lijkt de correcte telwoorden (tot
negenhonderdnegenennegentigduizend) wel te herkennen. Alleen krijg ik
in het geval van foutgespelde, samengestelde telwoorden niet de goede
suggesties. Hieronder wat voorbeelden:

---
vijftiehonderd
& vijftiehonderd 1 0: honderd

driehondervierentwinitig
# driehondervierentwinitig 0


vijfhonderddrieëntwintigduizen
# vijfhonderddrieëntwintigduizen 0
---

Daarnaast geeft Hunspell bij de correct gespelde, samengestelde
telwoorden een "-" i.p.v. een "*" als output. Ik zag in de manpages
van Hunspell dat dat de standaard output is voor compounds (wellicht
overbodig: voor manpages type "man hunspell" na de prompt).

Tot slot, het zou mooi zijn als we naast hoofdtelwoorden ook
rangtelwoorden (eerste, tweede, derde etc.) op deze manier opnemen.

Groet,
Bart

Op 2 juni 2008 21:45 heeft Ruud Baars <ruud.baars@...> het
volgende geschreven:

> Ik heb de truc met de getallen nog eens opnieuw gedaan.
>
> Het nadeel van de compounding is dat je alleen met echt bestaande woorden
> kunt werken.
>
> Hierbij het resultaat voor alle (niet-rang)telwoorden.
>
> De sheet geeft aan hoe ik ertoe ben gekomen, de .aff en .dic bevatten een
> testbare set.
>
> Ik ben met tags boven de 100 begonnen (om alles eronder te reserveren voor
> affixen) en heb het binnen de 3 pos gehouden.
>
> Willen jullie testen met goede en gekke getallen?
>
> Het zou zelfs moeten lopen tot en met getallen als
> negenennegentighonderdvijfendertigduizend.
> mvg
> Ruud
>


--
Vriendelijke groet,
Bart Knubben

| http://www.knubben.org | http://www.opentaal.org |

> http://www.minmen.nl - Een blog over de impact van het Internet op onze maatschappij en publieke sector <


_______________________________________________
Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
Juridische voorwaarden: http://opentaal.org/licentie.php

Re: Re: Getallen

by Bob van de Loo-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Dag Heren,

Ik ben nog niet in de gelegenheid geweest om er mee aan de slag te gaan.
Ik weet dat hunspell met componenten kan werken, en afhankelijk van die
componenten meerdere telwoorden zou kunnen maken.

Volgens mij kan je namelijk hunspell zelf de combinaties laten maken. Je
kan hunspell vertellen dat eenen- alleen in het begin en in het midden
mag voorkomen, honderdeenenzestig en eenenzestig.

Donderdagavond kan ik het verder uitwerken, het is analoog aan mijn
chemische structuren opzetje.

Groet,
Bob


On Tue, 2008-06-03 at 22:57 +0200, Bart Knubben wrote:

> Dag Ruud,
>
> Het lijkt me een begin van een elegante oplossing. Bij deze wat bevindingen.
>
> Hunspell lijkt de correcte telwoorden (tot
> negenhonderdnegenennegentigduizend) wel te herkennen. Alleen krijg ik
> in het geval van foutgespelde, samengestelde telwoorden niet de goede
> suggesties. Hieronder wat voorbeelden:
>
> ---
> vijftiehonderd
> & vijftiehonderd 1 0: honderd
>
> driehondervierentwinitig
> # driehondervierentwinitig 0
>
>
> vijfhonderddrieëntwintigduizen
> # vijfhonderddrieëntwintigduizen 0
> ---
>
> Daarnaast geeft Hunspell bij de correct gespelde, samengestelde
> telwoorden een "-" i.p.v. een "*" als output. Ik zag in de manpages
> van Hunspell dat dat de standaard output is voor compounds (wellicht
> overbodig: voor manpages type "man hunspell" na de prompt).
>
> Tot slot, het zou mooi zijn als we naast hoofdtelwoorden ook
> rangtelwoorden (eerste, tweede, derde etc.) op deze manier opnemen.
>
> Groet,
> Bart
>
> Op 2 juni 2008 21:45 heeft Ruud Baars <ruud.baars@...> het
> volgende geschreven:
> > Ik heb de truc met de getallen nog eens opnieuw gedaan.
> >
> > Het nadeel van de compounding is dat je alleen met echt bestaande woorden
> > kunt werken.
> >
> > Hierbij het resultaat voor alle (niet-rang)telwoorden.
> >
> > De sheet geeft aan hoe ik ertoe ben gekomen, de .aff en .dic bevatten een
> > testbare set.
> >
> > Ik ben met tags boven de 100 begonnen (om alles eronder te reserveren voor
> > affixen) en heb het binnen de 3 pos gehouden.
> >
> > Willen jullie testen met goede en gekke getallen?
> >
> > Het zou zelfs moeten lopen tot en met getallen als
> > negenennegentighonderdvijfendertigduizend.
> > mvg
> > Ruud
> >
>
>
>
> _______________________________________________
> Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
> Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
> Juridische voorwaarden: http://opentaal.org/licentie.php

SET ISO8859-1
TRY esianrtolcdugmphbyfvkwjkqxz-������������'ESIANRTOLCDUGMPHBYFVKWJKQXZ

KEY qwertzuop|yxcvbnm|qaw|say|wse|dsx|sy|edr|fdc|dx|rft|gfv|fc|tgz|hgb|gv|zhu|jhn|hb|uji|kjm|jn|iko|lkm

BREAK 1
BREAK -

FlAG num

COMPOUNDMIN 1
CHECKCOMPOUNDCASE

COMPOUNDBEGIN 2100
COMPOUNDMIDDLE 2010
COMPOUNDEND 2001 # of COMPOUNDLAST 2001

COMPOUNDPERMITFLAG 2666
ONLYINCOMPOUND 2999

PFX 2100 y 2
PFX 2100 0 di/2100
PFX 2100 0 tri/2100

SFX 2000 y 10
SFX 2000 0 aan/2001
SFX 2000 0 een/2001
SFX 2000 0 aanzuur/2001
SFX 2000 0 aandizuur/2001
SFX 2000 0 anoaat/2001
SFX 2000 0 aandizuur/2001
SFX 2000 0 anol/2001
SFX 2000 0 anal/2001
SFX 2000 0 yl/2100,2999
SFX 2000 0 yl/2010,2999


19
meth/2000
eth/2000
prop/2000
but/2000
pent/2000
hex/2000
fenyl/2100
benz/2010
benzoaat/2001
hept/2000
oct/2000
non/2000
dec/2000
dodec/2000
amine/2001
amide/2001
broom/2100,2010
bromide/2001
chloor/2100,2010
chloride/2001
jodide/2001

_______________________________________________
Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
Juridische voorwaarden: http://opentaal.org/licentie.php