[Python] regex killer

Daniele Varrazzo piro a develer.com
Mer 16 Ott 2013 13:45:15 CEST


On 2013-10-16 12:34, Giovanni Porcari wrote:
> Il giorno 16/ott/2013, alle ore 13:27, Marco Giusti
> <marco.giusti a gmail.com> ha scritto:
>
>> On Wed, Oct 16, 2013 at 01:09:26PM +0200, Giovanni Porcari wrote:
>>> Buongiorno a tutti
>>>
>>>
>>> Eseguendo questo codice in python 2.7.5 funziona correttamente
>>> ma in 2.7.2. e 2.7.3 python si impianta e non termina.
>>>
>>> Succede solo a me ?
>>
>> Che si pianti mi sembra normale. Ecco una letturina per la sera[1]
>> oppure il libro di Beri sulle regex.
>>
>> In pratica questa parte "(?P<nome>(?:\w*?\s*?)*?\w*)" ha un tempo di
>> eseguzione che è quadratico. Piuttosto mi stupische che la 2.7.5
>> funzioni, è cambiato qualcosa nell'implementazione?
>>
>> [1] http://swtch.com/~rsc/regexp/regexp1.html
>>
>> ciao
>>
>>> import re
>>>
>>> t="CURRICULUM Rossi Mazzanti Vien Dal Mare Mario DF/433/43"
>>> 
>>> r=r"^(?:CURRICULUM\s*)(?P<nome>(?:\w*?\s*?)*?\w*)\s*?(?P<codice>\w{2}/\w{3}/\w{2})\s*$"
>>> R=re.compile(r)
>>> a=re.search(R,t)
>>> print a.groups()
>
>
> Capisco che sia quadratico e mi sta bene ma parliamo di applicare la
> regex su una stringa di 55 caratteri.

Infatti, penso sia http://bugs.python.org/issue9669

v2.7.4                         83117:026ee0057e2d

changeset:   82226:dc8a11c16021
branch:      2.7
parent:      82219:c1b3d25882ca
user:        Serhiy Storchaka <storchaka a gmail.com>
date:        Sat Feb 16 21:23:01 2013 +0200
summary:     Issue #9669: Protect re against infinite loops on 
zero-width matching in

v2.7.3                         76200:70274d53c1dd

Direi rilasciato in 2.7.4.


-- 
Daniele Varrazzo - Develer S.r.l.
http://www.develer.com


Maggiori informazioni sulla lista Python