Munch/ aff-file

View: New views
5 Messages — Rating Filter:   Alert me  

Munch/ aff-file

by r.baars :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Wanneer het op de volledige ruwe nieuwe set woorden wordt losgelaten, is
het resultaat van munch 2 348 088 bytes groot.

Zo te zien niet veel groter dan wat we nu al hebben. We hoeven nmm dan ook
niets te doen aan de affixen voor de compressie.

mvg
Ruud

_______________________________________________
Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
Juridische voorwaarden: http://opentaal.org/licentie.php

Re: Munch/ aff-file

by Bart Knubben :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Mooi! Hoe lang heeft je machine erover gedaan?

Groet,
Bart

Op 5 juni 2008 18:14 heeft R.J. Baars <r.j.baars@...> het
volgende geschreven:

> Wanneer het op de volledige ruwe nieuwe set woorden wordt losgelaten, is
> het resultaat van munch 2 348 088 bytes groot.
>
> Zo te zien niet veel groter dan wat we nu al hebben. We hoeven nmm dan ook
> niets te doen aan de affixen voor de compressie.
>
> mvg
> Ruud
>
> _______________________________________________
> Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
> Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
> Juridische voorwaarden: http://opentaal.org/licentie.php
>


--
Vriendelijke groet,
Bart Knubben

| http://www.knubben.org | http://www.opentaal.org |

> http://www.minmen.nl - Een blog over de impact van het Internet op onze maatschappij en publieke sector <

_______________________________________________
Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
Juridische voorwaarden: http://opentaal.org/licentie.php

Re: Munch/ aff-file

by r.baars :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Het 'munchecn met de huidige .aff-file duuurde ruime 220 minuten. Doe ik een poging met een .aff-file met FLAG=num, dan doet ie er ruim 400 minuten over ... en wordt de omvang 1.5*zo groot ...


Bart Knubben schreef:
Mooi! Hoe lang heeft je machine erover gedaan?

Groet,
Bart

Op 5 juni 2008 18:14 heeft R.J. Baars r.j.baars@... het
volgende geschreven:
  
Wanneer het op de volledige ruwe nieuwe set woorden wordt losgelaten, is
het resultaat van munch 2 348 088 bytes groot.

Zo te zien niet veel groter dan wat we nu al hebben. We hoeven nmm dan ook
niets te doen aan de affixen voor de compressie.

mvg
Ruud

_______________________________________________
Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
Juridische voorwaarden: http://opentaal.org/licentie.php

    



  

_______________________________________________ Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php Juridische voorwaarden: http://opentaal.org/licentie.php


_______________________________________________
Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
Juridische voorwaarden: http://opentaal.org/licentie.php

Re: Munch/ aff-file

by Bart Knubben :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Dat scheelt nogal. Waarvoor dient de FLAG=num parameter precies?

Groet,.
Bart

Op 6 juni 2008 07:18 heeft r.baars <r.j.baars@...> het volgende
geschreven:

> Het 'munchecn met de huidige .aff-file duuurde ruime 220 minuten. Doe ik een
> poging met een .aff-file met FLAG=num, dan doet ie er ruim 400 minuten over
> ... en wordt de omvang 1.5*zo groot ...
>
>
> Bart Knubben schreef:
>
> Mooi! Hoe lang heeft je machine erover gedaan?
>
> Groet,
> Bart
>
> Op 5 juni 2008 18:14 heeft R.J. Baars <r.j.baars@...> het
> volgende geschreven:
>
>
> Wanneer het op de volledige ruwe nieuwe set woorden wordt losgelaten, is
> het resultaat van munch 2 348 088 bytes groot.
>
> Zo te zien niet veel groter dan wat we nu al hebben. We hoeven nmm dan ook
> niets te doen aan de affixen voor de compressie.
>
> mvg
> Ruud
>
> _______________________________________________
> Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
> Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
> Juridische voorwaarden: http://opentaal.org/licentie.php
>
>
>
>
>
> ________________________________
> _______________________________________________
> Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
> Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
> Juridische voorwaarden: http://opentaal.org/licentie.php
>


--
Vriendelijke groet,
Bart Knubben

| http://www.knubben.org | http://www.opentaal.org |

> http://www.minmen.nl - Een blog over de impact van het Internet op onze maatschappij en publieke sector <

_______________________________________________
Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
Juridische voorwaarden: http://opentaal.org/licentie.php

Parent Message unknown Re: Munch/ aff-file

by r.baars :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

FLAG num

zorgt ervoor dat je meer ruimte hebt om 'flags' te definieren.
Voor de affixen hebben we dat niet nodig, maar als we met
woordsamenstellingen gaan werken, dan hebben we er veel meer nodig dan de
a-z. Het werken met samenstellingen gaat wel weer veel ruimte schelen. Zo
zijn er tienduizendtalleen goede getal-woorden, en met 100 + 5 regels zijn
die allemaal afgedekt.

Datzelfde geldt voor stam+baar etc ...

Wanneer we koppelbare woord-groepen gaan onderkennen, maar veilig willen
blijven om slechte combinaties te voorkomen, dan hebben we veel van die
flags nodig.

Met num kunnen we tot 65000.

Er kan ook nog voor 2-letter-combinaties worden gekozen. Dan hebben we er
ook al meer.


> Dat scheelt nogal. Waarvoor dient de FLAG=num parameter precies?
>
> Groet,.
> Bart
>
> Op 6 juni 2008 07:18 heeft r.baars <r.j.baars@...> het volgende
> geschreven:
>> Het 'munchecn met de huidige .aff-file duuurde ruime 220 minuten. Doe ik
>> een
>> poging met een .aff-file met FLAG=num, dan doet ie er ruim 400 minuten
>> over
>> ... en wordt de omvang 1.5*zo groot ...
>>
>>
>> Bart Knubben schreef:
>>
>> Mooi! Hoe lang heeft je machine erover gedaan?
>>
>> Groet,
>> Bart
>>
>> Op 5 juni 2008 18:14 heeft R.J. Baars <r.j.baars@...> het
>> volgende geschreven:
>>
>>
>> Wanneer het op de volledige ruwe nieuwe set woorden wordt losgelaten, is
>> het resultaat van munch 2 348 088 bytes groot.
>>
>> Zo te zien niet veel groter dan wat we nu al hebben. We hoeven nmm dan
>> ook
>> niets te doen aan de affixen voor de compressie.
>>
>> mvg
>> Ruud
>>
>> _______________________________________________
>> Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
>> Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
>> Juridische voorwaarden: http://opentaal.org/licentie.php
>>
>>
>>
>>
>>
>> ________________________________
>> _______________________________________________
>> Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
>> Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
>> Juridische voorwaarden: http://opentaal.org/licentie.php
>>
>
>
>
> --
> Vriendelijke groet,
> Bart Knubben
>
> | http://www.knubben.org | http://www.opentaal.org |
>
>> http://www.minmen.nl - Een blog over de impact van het Internet op onze
>> maatschappij en publieke sector <
> _______________________________________________
> Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
> Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
> Juridische voorwaarden: http://opentaal.org/licentie.php


_______________________________________________
Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
Juridische voorwaarden: http://opentaal.org/licentie.php
LightInTheBox - Buy quality products at wholesale price