Casos de Estudio

El problema es encontrar los códigos que comienzan por 12. En negrita se han resaltado las soluciones. Son soluciones sólo aquellas que, comienzan por 12 en una posición múltiplo de seis. Una solución es:

que genera una lista con los números y luego selecciona los que comienzan por 12. Otra solución es:

que aprovecha que la expresión regular devolverá una lista vacía cuando el número no empieza por 12:

¿Se puede resolver el problema usando sólamente una expresión regular? Obsérvese que esta solución ``casi funciona'':

recoge la secuencia mas corta de grupos de seis dígitos que no casan, seguida de una secuencia que casa. El problema que tiene esta solución es al final, cuando se han casado todas las soluciones, entonces la búsqueda exhaustiva hará que nos muestre soluciones que no comienzan en posiciones múltiplo de seis. Por eso encuentra 123345:

Se asume que existe al menos un éxito en la entrada inicial. Que es un extraordinario ejemplo de como el uso de paréntesis de agrupamiento simplifica y mejora la legibilidad de la solución. Es fantástico también el uso del operador de predicción negativo.

Solución usando el ancla G

El ancla \G ha sido concebida para su uso con la opción /g. Casa con el punto en la cadena en el que terminó el último emparejamiento. Cuando se trata del primer intento o no se está usando /g, usar \G es lo mismo que usar \A.

Mediante el uso de este ancla es posible formular la siguiente solución al problema planteado:

Sustitución

Si lo que se quiere es sustituir las secuencias deseadas es poisble hacerlo con la siguiente expresión regular:

Palabras Repetidas

Análisis de cadenas con datos separados por comas

Esta línea representa cinco campos. Es razonable querer guardar esta información en un array, digamos @field, de manera que $field[0] == 'earth', $field[1] == '1', etc. Esto no sólo implica descomponer la cadena en campos sino también quitar las comillas de los campos entrecomillados. La primera solución que se nos ocurre es hacer uso de la función split:

Pero esta solución deja las comillas dobles en los campos entrecomillados. Peor aún, los campos entrecomillados pueden contener comas, en cuyo caso la división proporcionada por split sería errónea.

Las subrutinas en Perl reciben sus argumentos en el array @_. Si la lista de argumentos contiene listas, estas son ``aplanadas'' en una única lista. Si, como es el caso, la subrutina ha sido declarada antes de la llamada, los argumentos pueden escribirse sin paréntesis que les rodeen:

Otro modo de llamar una subrutina es usando el prefijo &, pero sin proporcionar lista de argumentos.

Los operadores push (usado en la línea 17) y pop trabajan sobre el final del array. De manera análoga los operadores shift y unshift lo hacen sobre el comienzo. El operador ternario ? trabaja de manera análoga como lo hace en C.

La segunda parte del código muestra que existe un módulo en Perl, el módulo Text::Parsewords que proporciona la rutina quotewords que hace la misma función que nuestra subrutina.

Las Expresiones Regulares como Exploradores de un Árbol de Soluciones

Números Primos

Ecuaciones Diofánticas: Una solución

La siguiente sesión con el depurador muestra como se puede resolver una ecuación lineal diofántica con coeficientes positivos usando una expresión regular:

Ecuaciones Diofánticas: Todas las soluciones

Ecuaciones Diofánticas: Resolutor general

El siguiente programa recibe en línea de comandos los coeficientes y término inependeinte de una ecuación lineal diofántica con coeficientes positivos y muestra todas las soluciones. El algoritmo primero crea una cadena conteniendo el código Perl que contiene la expresión regular adecuada para pasar luego a evaluarlo:

Las Tres Hijas

Ejercicio 31.5.1 Dos matemáticos se vieron en la calle después de muchos años sin coincidir.

¡Hola!, ¿qué tal?, ¿te casaste?, y... ¿cuántos hijos tienes?
Pues tengo tres hijas.
¿y qué años tienen?
¡A ver si lo adivinas!: el producto de las edades de las tres es 36, y su suma es el número del portal que ves enfrente...
¡Me falta un dato!
¡Ah, sí!, ¡la mayor toca el piano!

¿Qué edad tendrán las tres hijas?

¿Podemos ayudarnos de una expresión regular para resolver el problema? Al ejecutar el siguiente programa:

pl@nereida:~/Lperltesting$ cat -n playspiano.pl
 1  #!/usr/local/lib/perl/5.10.1/bin//perl5.10.1  -w
 2  use v5.10;
 3  use strict;
 4  use List::Util qw{sum};
 5
 6  local our %u;
 7  sub f {
 8    my @a = @_;
 9    @a = sort { $b <=> $a } (length($a[1]), length($a[0])/length($a[1]), 36/length($a[0]) );
10
11    local $" = ", ";
12    say "(@a)\t ".sum(@a) unless exists($u{"@a"});
13    $u{"@a"} = undef;
14  }
15
16  say "SOL\t\tNUMBER";
17  my @a =  ('1'x36) =~
18           /^((1+)\2+)(\1+)$
19                     (?{ f($1, $2, $3)
20                      })
21             (*FAIL)
22           /x;

obtenemos la salida:

pl@nereida:~/Lperltesting$ ./playspiano.pl
SOL             NUMBER
(9, 2, 2)        13
(6, 3, 2)        11
(4, 3, 3)        10
(18, 2, 1)       21
(12, 3, 1)       16
(9, 4, 1)        14
(6, 6, 1)        13

Explique el funcionamiento del programa. A la vista de la salida ¿Cuáles eran las edades de las hijas?

Mochila 0-1

Véase también

Número de substituciones realizadas

Expandiendo y comprimiendo tabs

Ejercicio 31.5.3 ¿Funciona igual si se cambia el bucle while por una opción /g?
pl@nereida:~/Lperltesting$ cat -n ./expandtabs2.pl 1 #!/usr/bin/perl -w 2 use strict; 3 4 my @string = <>; 5 6 for (@string) { 7 s/\t+/' ' x (length($&)*8 - length($`)%8)/ge; 8 print $_; 9 }
¿Porqué?

Modificación de Múltiples Ficheros: one liner

Este programa sustituye la palabra original (g)lobalmente e i)gnorando el ``case'') en todos los ficheros *.html y para cada uno de ellos crea una copia de seguridad *.html.bak.

Otro ejemplo: la sustitución que sigue ocurre en todos los ficheros info.txt en todos los subdirectorios de los subdirectorios que comiencen por alu:

En general las opciones pueden ponerse en la primera línea del ``script'', donde se indica el intérprete. Asi pues, decir