Análisis de la red de fichajes de futbolistas entre las principales ligas europeas en el mercado de verano 2014-2015.

July 21, 2017 | Autor: Laplace Demon | Categoría: Football (soccer), Complex Networks
Share Embed


Descripción

An´alisis de la red de fichajes de futbolistas entre las principales ligas europeas en el mercado de verano 2014-2015. Alfonso de Miguel 9 сентября 2014 г.

Аннотация En esta tarea el objetivo es el an´alisis de una red compleja. El ejemplo considerado es una red de fichajes, o flujos migratorios de jugadores, entre los equipos de las ligas futbol´ısticas m´ as importantes de Europa, ocurrido en la ventana de verano para la temporada 2014-2015. El software utilizado para este an´alisis y para la representaci´on del grafo ha sido Gephi. Explicaremos y analizaremos algunas m´etricas b´ asicas de la red: distribuci´ on de grado, longitud de camino medio, coeficiente de clustering, y estudiaremos su modularidad, entre otras cuestiones.

0.1 Introducci´on. Para bien o para mal, es indudable que el deporte del f´ utbol juega un papel muy destacado en la sociedad contemporanea y que trasciende las fronteras y cultura de cualquier naci´on. Jugado por unos 250 millones de jugadores en 200 pa´ıses, es el deporte m´as popular en el mundo. Tanto para el observador externo (l´ease: aficionado) como para los internos (jugadores y clubes), una parte muy importante y suculenta en el desarrollo de una temporada futbol´ıstica es la transferencia, cesi´on, o intercambio de jugadores entre los distintos equipos de f´ utbol; el mercado de fichajes. Estos procesos de negociaci´on y contrataci´on se pueden realizar durante todo el a˜ no, pero se materializan o se hacen oficialmente efectivos en las denominadas ventanas de fichajes, que suceden a mitad de temporada: ventana o mercado de invierno, y al final de temporada: ventana o mercado de verano. Este fen´omeno es el que caracteriza las portadas de los diarios deportivos en la temporada estival, y altera y mantiene alimentados a los m´as forofos, que ans´ıan impacientes el comienzo de una nueva temporada para ver a los cracks lucir las camisetas de sus equipos. Aunque esta claro que que aqu´ı los mayores beneficiados est´an a otro nivel, son los mismos equipos de f´ utbol, y los jugadores agraciados, que se mueven en org´ıas de millones de euros en los contratos m´as medi´aticos. El excesivo coste de algunos jugadores de f´ utbol y, en general, los millones que mueve este deporte ser´ıan y habr´an sido dignos

1

de an´alisis tambi´en, pero aqu´ı no entraremos en cuestiones de mercado. Tampoco nos interesamos por si el Madrid ha vendido a jugadores clave y necesita fichar un delantero centro con gol. Simplemente se analiza el flujo de jugadores, su volumen y direcciones, en el mercado de verano, antesala de la temporada futbol´ıstica 2014/2015. El gui´on del trabajo es el siguiente. En la secci´on primera se explica en detalle la construcci´on de la red. En la secci´on segunda se pasa al an´alisis de las medidas m´as relevantes y b´asicas de la red; tambi´en comentamos en profundidad algunos de los resultados obtenidos. En la secci´on tercera se resumen el trabajo y se destacan algunas medidas obtenidas, tambi´en se proponen nuevos frentes en los que realizar un posible trabajo futuro.

1 Red de migraciones de futbolistas en el mercado de verano 2014/2015. 1.1 Construcci´on del grafo. Para el an´alisis del movimiento de futbol´ıstas en el mercado de verano 2014/2015 se ha construido un grafo G pesado y direccionado. Este est´a definido por un conjunto N (G) de N nodos, un conjunto E(G) de M enlaces, y una aplicaci´on ω : E → R, que da cuant´ıa del peso de cada enlace. El conjunto de nodos de la red est´a conformado por un total de N = 880 clubes de f´ utbol de todo el mundo; aqu´ı entran equipos de primeras divisiones (categor´ıa m´axima nacional) pero tambi´en equipos de divisiones inferiores, equipos reserva o equipos filiales. Eso s´ı, hay que hacer algunas matizaciones: no aparecen todos los clubes de f´ utbol oficiales y/o profesionales del mundo (el n´ umero crecer´ıa en m´as de tres ´ordenes de magnitud), y no todos los clubes est´an igual de analizados; desarrollemos esto u ´ltimo. Aunque todos los nodos son clubes de f´ utbol, dadas las magnitudes de nodos involucrados no se ha podido ’cerrar’ la red. El objetivo ha sido centrarse en el an´alisis de los movimientos de los clubes de primera divisi´on de las principales ligas europeas, las 8 primeras seg´ un el ranking UEFA [5], a saber: Primera Divisi´on espa˜ nola, Premier League inglesa, Bundesliga alemana, Seria A italiana, Primeira Liga portuguesa, Ligue 1 francesa, Чемпионат по футболу (Premier League) rusa y Eredivisie holandesa. Por tanto, todos los equipos pertenecientes a estas categor´ıas est´an completamente caracterizados: todas sus conexiones de entrada y salida est´an registradas. Sin embargo, las transferencias de jugadores no se limitan, ni much´ısimo menos, a clubes relativos a estas divisiones sino que la red se extiende a categor´ıa inferiores dentro de un pa´ıs, y m´as all´a de las fronteras y de los continentes. En este sentido, tenemos clubes de Holanda, Alemania, o Portugal estableciendo conexiones con clubes en sudam´erica, Catar o Jap´on, pero el nivel de detalle requerido nos lleva a no caracterizar las relaciones entre equipos fuera de estas ocho ligas mencionadas; as´ı, por ejemplo, la red no recoge los movimientos entre los equipos de Argentina, ni las relaciones entre equipos griegos y turcos. En definitiva, no todas las interacciones posibles de todos los nodos que surgen han podido ser consideradas. 2

Aclarado el punto de los nodos, expliquemos en detalle la formaci´on de los enlaces entre nodos. Nos hemos fijado en los movientos de los jugadores entre clubes en las principales ligas europeas en el mercado de verano 2014/2015 [4]. ¿Cu´al es la regla concreta de conexi´on? Dado que las conexiones son dirigidas, un nodo i recibir´a una flecha proveniente de un nodo j si el jugador m (que ser´ıa el enlace en s´ı mismo) particip´o en la temporada 2013/2014 con el club j y en la pr´oxima, 2014/2015, lo har´a con el club i; viceversa si se ve desde la perspectiva de una flecha que sale de un nodo. Por ejemplo, en la temporada anterior, el uruguayo Luis Su´arez jug´o con el Liverpool FC, y esta temporada que ya ha comenzado lo hace con el FC Barcelona, en consecuencia, una conexi´on dirigida sale del nodo correspondiente al Liverpool FC y apunta hacia el nodo asociado al FC Barcelona. Una cuesti´on a saber sobre la ’propiedad’ de los jugadores: en muchas transferencias no se producen compras de jugadores sino pr´estamos, un jugador puede ir cedido a un tal club por X motivos, pero el club que lo recibe no ser´ıa el propiterario de tal jugador. Esta red se ha orientado a los movimientos de jugadores y, en consecuencia, esta cuesti´on no la ha tenido en cuenta. Valga el siguiente ejemplo: el jugador ghan´es Thomas es propiedad del Atl´etico de Madrid, en la temporada anterior jug´o en el RCD Mallorca y para esta nueva temporada ha sido cedido (desde su club propietario) al UD Almer´ıa; en consecuencia, seg´ un la regla aqu´ı establecida, establecemos en el enlace en direcci´on al nodo del UD Almer´ıa proveniente desde el RCD Mallorca, y no desde el Atl´etico de Madrid. A lo largo del texto se habla de transferencias de jugadores pero ha de entenderse, dado lo que he explicado ahora, en t´erminos de movimiento de un jugador de un club a otro, y no como una transacci´on contractual entre un vendedor y un comprador. Adem´as, en otro orden de aclaraciones, las autoconexiones est´an descartadas a cambio de la creaci´on de nodos de equipos filiales, juveniles o reserva cuando ha sido preciso. Y finalmente la cuesti´on de los pesos. Como se ha indiciado, el grafo no solo es dirigido sino que es pesado, esta caracter´ıstica se introduce para dar cuenta de casos en los que varios jugadores de un mismo club acaban en un solo club en esta nueva temporada. Por ejemplo, si tres jugadores del SL Benfica portugu´es acaban en el Atl´etico de Madrid, el enlace que une ambos clubes, con direcci´on hacia el espa˜ nol, tiene un peso de wij = 3; cuando u ´nicamente un club aporta un solo jugador a otro club, el peso es evidentemente la unidad.

1.2 Presentaci´on del grafo y un primer an´alisis visual. El apartado gr´afico y anal´ıtico se han llevado a cabo mediante el programa Gephi [6]. En este apartado presentamos algunas im´agenes globales de la red y podemos empezar a hacernos una idea visual del conjunto. Los nodos est´an coloreados en una gama de azules. Cuanto m´as oscuro este, mayor es el grado del nodo; y cuanto m´as claro, menor es el grado (siendo el grado la suma del grado de entrada m´as el de salida). Esta gradaci´on de colores no es proporcional al grado sino que se ha utilizado un spline concreto (figura 2), favoreciendo en seguida un color m´as oscuro a poco que el grado del nodo es m´ınimamente 3

grande. En la figura 1 aparece la red con las etiquetas de los nodos, aunque son patentes los problemas de legibilidad. El algoritmo empleado para la distribuci´on de los nodos ha sido un ForceAtlas 2.

Modificando el spline podemos hacer ´enfasis en determinados nodos. Por ejemplo, mediante este spline en forma de escal´on (figura 3), obtenemos la siguiente visualizaci´on de la red (figura 4). Este spline, como puede verse, ha favorecido el ´enfasis en los nodos con un grado elevad´ısimo. Tal es as´ı que solo se nos presenta un nodo con un tono azul oscuro, que corresponde al Parma FC italiano, con un grado k = 70, grado de entrada kin = 35 y kout = 35. Se encuentra que este es el nodo que aporta una mayor movilidad a 4

los futbolistas, por as´ı decirlo, 35 clubes diferentes han transferido (al menos) un jugador al Parma, y el Parma ha transferido, al menos, un jugador a 35 clubes diferentes. Como se ver´a m´as adelante, el Parma FC es el mayor hub de la red.

Pero v´ease que a´ un podemos incrementar el filtro y discriminar hasta que el u ´nico nodo coloreado de azul intenso (frente al resto, que palidecen al blanco) sea el correspondiente a dicho club (figura 5). Una nueva propuesta de spline permite rescatar otros nodos de alta importancia en el entramado (figura 6). Los nodos resaltados ahora son los correspondientes al Parma FC (k = 70), Hellas Verona (k = 50), Udinese Calcio (k = 44), AS Roma (k=43), y la Juventus de Tur´ın (k=41); n´otese que todos corresponden a la primera divisi´on italiana, la Serie A. Prestando atenci´on a los datos en bruto, uno puede ir observando la tendencia, 5

a priori l´ogica, de que la mayor parte de las transferencias se produc´ıa entre clubes que pertenec´ıan a una misma liga o pa´ıs. Este comportamiento sugerir´ıa la formaci´on de comunidades, componentes del grafo cuyos elementos constituyentes, determinados nodos, tienen una conexi´on m´as fuerte entre s´ı que entre nodos de otras comunidades. El uso del algoritmo ForceAtlas 2, as´ı como de ForceAtlas m´as claramente, evidenci´o que, precisamente, favorec´ıa una distribuci´on, una espacializaci´on de la red de forma tal que uno pod´ıa a simple vista contemplar una agrupaci´on en comunidades, entendi´endose estas comunidades como las ocho ligas europeas consideradas. Como prueba la figura 7. En general podemos encontrar a los equipos dentro de cada una de las principales ligas europeas muy cerca, espacialmente, en el grafo. Los equipos italianos tienden a estar rodeados de equipos italianos, los franceses con los franceses, y as´ı. Adem´as, algunas de estas agrupaciones tiende a ser muy evidente y diferenciada del resto. Especialmente para 6

el caso de las ligas italiana, rusa y portuguesa. Las otras ligas: inglesa, espa˜ nola, alemana, francesa y holandesa aparecen espacialmente m´as pr´oximas, m´as compactadas, pero la diferenciaci´on, la intromisi´on de equipos de unas de estas en las comunidades de las otras tambi´en se hace notable con un an´alisis visual.

2 An´alisis de la red. Tras un an´alisis preliminar y visual de la red, en esta secci´on definimos las caracter´ısticas principales de una red gen´erica as´ı como las medidas principales que llevamos a cabo en el an´alisis de esta y mostramos los resultados relativos a nuestro grafo. Las medidas llevadas a cabo han sido realizadas con el programa Gephi.

2.1 Distribuci´on de grado. El grado de un nodo de la red se define como el n´ umero de enlaces o conexiones que tiene con el resto de nodos de la red y puede designarse como k(ni ). As´ı, si un nodo i comparte enlace con otros dos nodos diferentes j y k, el grado del nodo i ser´ıa k(i) = 2. En este sentido uno puede hablar de la distribuci´on del grado si tiene en cuenta el n´ umero de conexiones de cada uno de los nodos de la red y n(k) designar´ıa el n´ umero de nodos de

7

la red que tienen grado k. Uno puede normalizar esta medida dividiendo por el n´ umero de nodos que conforman la red, sea N , para dar lugar a la magnitud que definimos como la distribuci´ on de grado: n(k) p(k) = (1) N La fracci´on entre el n´ umero de nodos con un grado k entre el n´ umero total de nodos de la red puede interpretarse tambi´en como la probabilidad de que un nodo elegido aleatoriamente tenga grado k. Para nuestro caso de la red de migraciones futbolistas, la distribuci´on de grado total, de entrada, y de salida obtenida es la siguiente (figuras 8):

Los histogramas revelan un comportamiento que podr´ıa ser t´ıpico de una distribuci´on de grado tipo ley de potencias: p(k) ∝ k −γ . (2) Tomamos la distribuci´on de grado total y realizamos un ajuste lineal tomando logaritmos. Como puede verse en la figura, los primeros puntos de la recta se ajustan bastante bien y, como era esperable, la cola de la distribuci´on tiene una mayor dispersi´on. 8

Con γ = 1.42 ± 0.11 Para un grado superior al mostrado, evidentemente, la ley de potencias desaparece, para grado k > 45 ya no existen nodos que punt´ uen y al tomar logaritmos obtenemos divergencias; el comportamiento lineal de la distribuci´on logaritm´ıca (o el comportamiento de ley de potencias) habr´ıa que enmarcarlo en el contexto de la parte de k peque˜ no de la distribuci´on. Adem´as, hay que considerar que este comportamiento ha surgido cuando nos hemos centrado en la interacci´on completa entre las 8 ligas principales de Europa; si incluy´eramos por completo todas las interacciones de todos los nodos que aparecen en la red es muy posible que la la distribuci´on de grado tendiera a uniformarse (habr´ıa que ver hasta qu´e punto), ya que los equipos que en este estudio presentan menor grado, la mayor´ıa de ellos no es debido a que verdaderamente hayan transferido menos jugadores, sino porque al pertenecer a ligas menores, no hemos considerado completamente todas sus interacciones. El grado medio computado es de hki = 2.63

9

Tambi´en mostramos las distribuciones de grado teniendo en cuenta los pesos: En estas circunstancias el grado medio computado es de hkweighted i = 2.947

2.2 Densidad del grafo. Se dice que un grafo es denso si el n´ umero de enlaces o conexiones entre los nodos del mismo est´a pr´oximo al m´aximo n´ umero de enlaces posibles. Por contraria, hablar´ıamos de un grafo que es disperso si se trata con una red con un escaso n´ umero de enlaces. Esta distinci´on entre un tipo u otro de grafo es realmente vaga y puede dejarse a la interpretaci´on seg´ un el problema o contexto. Si calculamos la densidad de grafo teniendo en cuenta que una red no dirigida, obtenemos ρ = 0.006 , frente a la mitad, evidentemente, si calculamos la densidad de grafo considerando que la red es dirigida ρ = 0.003 Esto es porque un grafo dirigido la interacci´on entre dos nodos puede apuntar hacia uno y/o hacia el otro; por ello, el n´ umero de enlaces posibles se duplica. Teniendo en cuenta que el grafo es completo cuando ρ = 1 y se va dispersando si ρ → 0, los resultados muestran que nuestra red, dirigida o no, es dispersa. Esta carencia de densidad es entendible partiendo de la base mencionada en la secci´on de explicaci´on de construcci´on de la red, donde aclar´abamos que no todas las interacciones posibles (en la realidad) de los nodos hab´ıan sido recogida. No obstante, posiblemente la densidad podr´ıa aumentarse concentr´andonos solo en las ocho ligas principales y desechando de la red las interacciones que implicaran equipos ajenos a estas ligas. De todos modos este resultado no tiene ning´ un problema y nos viene a decir que el grado de interacci´on en t´erminos de migraci´on de jugadores entre los equipos de la red es muy peque˜ no. Lo cual es razonable puesto que un club de f´ utbol tiene un presupuesto, y una capacidad t´ecnica y de plantilla limitadas, como para mover jugadores con cualquier otro equipo del mundo. Y cada equipo intenta atraer hacia s´ı un n´ umero limitado de jugadores que satisfagan sus necesidades t´ecnicas y que est´en a un nivel razonable y ciertamente parejo de calidad y presupuesto; es decir, es complicado que un primera divisi´on de ´elite, como el Real Madrid, busque interacciones con clubes de ligas de baja calidad o de divisiones inferiores, sea para fichar o vender jugadores, dadas la falta de atractivo o la limitaci´on del presupuesto del equipo peque˜ no. A´ un as´ı, este tipo de interacciones ocurren, pero como los resultados aqu´ı muestran, son muy escasas.

10

2.3 Medidas relacionadas con la distancia. Para grafos sin peso y no dirigidos, el n´ umero de enlaces en un camino que conecta los v´ertices i y j se denomina longitud del camino. Un camino geod´ esico o camino m´ as corto, entre los v´ertices i y j, es uno de los caminos que conecta tales v´ertices y tiene la longitud m´ınima; la longitud de los caminos geod´esicos se denomina distancia geod´ esica dij entre los v´ertices i y j. Si el grafo tiene pesos puede aplicarse la misma definici´on, aunque generalmente uno podr´ıa estar m´as interesado en considerar los pesos asociados a las conexiones entre nodos. Para grafos dirigidos, tambi´en puede aplicarse la misma definici´on, pero en general dij 6= dji . La excentricidad es una medida asociada al nodo, y es la distancia geod´esica m´as grande entre un tal nodo i y cualquier otro nodo j. El di´ ametro de una red es la m´axima excentricidad de entre los nodos que la conforman. Con Gephi obtenemos que el valor del di´ametro es max dij = 10. Esto significa que los nodos, conectados, m´as separados en la red, est´an unidos por un m´aximo de 10 conexiones. Cuatro equipos presentan la m´axima excentricidad: Equipo Brisbane Roar Slask Wroclaw Lokomotiv Moskva 2 Fakel Voronezh

Liga (pa´ıs) Australia Polonia Rusia Rusia

Categor´ıa Primera Primera Filial Segunda

Excentridad 10 10 10 10

Todos estos equipos est´an conectados u ´nicamente al Torpedo Moskva, mediante conexiones dirigidas al equipo moscovita. Por su parte, puede verse que las exportaciones de jugadores del Torpedo Moskva van u ´nicamente a dos equipos que se quedan en Rusia, y un an´alisis de las exportaciones de estos otros dos vuelve a revelar que los equipos de destino son menores o aislados en Rusia. Analizando el agrupamiento de la liga rusa en particular seguramente nos har´ıamos una idea bastante clara de porqu´e particularmente estos equipos tienen las mayores excentricidades. El patr´on de equipo que encabeza esta lista es un equipo de categor´ıa inferior o de ligas menores. Tenemos la cuesti´on de siempre, el hecho de no haber registrado las interacciones entre equipos de categor´ıas y ligas menores nos lleva a un posible mayor aislamiento de estos en una visi´on global de la red. De todos modos, estos datos obtenidos no ofuscan el hecho de que, dada su condici´on de equipo menor, es razonable que no sean nodos centrales e importantes en una red de migraciones futbol´ısticas basada en las ligas m´as importantes. Una visi´on m´as general de la excentricidad en la red se tiene en la figura 10. El radio de la red es la m´ınima excentricidad de cualquier nodo. Es decir, dentro de las distancias geod´esicas m´as grandes que separan a dos nodos cualesquiera de la red,

11

ser´ıa la menor de estas. Obtenemos que el radio de la red es r=0 La distancia geod´ esica media o longitud media de camino m´ as corto es la media sobre todas las parejas de nodos ij de sus distancias dij `=

X 1 dij N (N − 1)

(3)

i6=j

Para nuestra red obtenemos que ` = 4.524 Es decir, de media, los nodos de esta red est´an separados por unos 4.5 enlaces.

2.4 Transitividad. Se dice que una red transitiva es aquella en la cual, por cada 3 nodos i, j y k, si existe una conexi´on entre i y j, y entre j y k, entonces existe una conexi´on entre i y k tambi´en. Una forma de medir la transitividad es por medio del coeficiente de agrupamiento o coeficiente de clustering. El coeficiente de clustering para un v´ertice i se define como el cociente entre el n´ umero total de conexiones entre los vecinos de i y el n´ umero total de posibles conexiones entre sus vecinos. Esto es Ci = 

12

L , n 2

(4)

donde L es el n´ umero de conexiones reales entre los vecinos del nodo i y n es el n´ umero de vecinos de este nodo i. El coeficiente medio de clustering de toda la red es la medida de los coeficientes de clustering sobre todos los nodos, C=

N 1 X Ci N

(5)

i

Si analizamos el coeficiente medio de clustering de nuestra red sin considerar que es dirigida, tenemos que este es Cundirected = 0.187 Siendo el valor m´aximo de este coeficiente la unidad, que implicar´ıa el agrupamiento m´as fuerte posible, estamos mucho m´as pr´oximos a una red con un acoplamiento d´ebil. El n´ umero de tri´angulos que existe en estas condiciones es #∆ = 837 La distribuci´on del coeficiente de clustering individual tomando la red como no dirigida es la mostrada en la figura 9:

Ahora, considerando que estamos ante una red dirigida, el c´omputo del coeficiente medio de clustering es Cdirected = 0.058

2.5 Hubs y autoridades. En el contexto de grafos dirigidos y del an´alisis de conexiones en la WWW, surgen los conceptos de hub y autoridad de la siguiente manera: Un (buen) hub se dice que es 13

aquella p´agina (o nodo, gen´ericamente) que apunta hacia muchas otras p´aginas; una (buena) autoridad representar´ıa a una p´agina que ha sido enlazada por muchos hubs diferentes. Esta m´etrica asignar´ıa dos puntuaciones a cada p´agina. La autoridad estimar´ıa el valor del contenido de la p´agina, y su valor de hub estimar´ıa el valor de los enlaces a otras p´aginas. Se ha computado con Gephi el grado de hub y autoridad de los distintos nodos. A continuaci´on mostramos los valores m´as altos de cada m´etrica. Para los hubs: Equipo Parma FC AS Roma Udinese Calcio Hellas Verona Juventus Sevilla FC Liverpool FC Sampdoria FC Porto Chievo Verona SSC Napoli Granada CF ACF Fiorentina AC Milan Internazionale

Liga (pa´ıs) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Primera Divisi´on (Espa˜ na) Premier League (Inglaterra) Serie A (Italia) Primeira Liga (Portugal) Serie A (Italia) Serie A (Italia) Primera Divisi´on (Espa˜ na) Serie A (Italia) Serie A (Italia) Serie A (Italia)

Categor´ıa Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera

Hub 0.013 0.011 0.009 0.009 0.008 0.008 0.008 0.008 0.008 0.008 0.008 0.007 0.007 0.007 0.007

Categor´ıa Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera

Autoridad 0.013 0.01 0.009 0.009 0.008 0.007 0.007 0.007 0.007 0.007 0.007 0.007 0.007 0.007

Y para las autoridades: Equipo Parma FC Hellas Verona Udinese Calcio AS Roma Juventus Sevilla FC Chievo Verona Boavista SL Benfica FC Porto Granada CF Liverpool FC ACF Fiorentina SSC Napoli

Liga (pa´ıs) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Primera Divisi´on (Espa˜ na) Serie A (Italia) Primeira Liga (Portugal) Primeira Liga (Portugal) Primeira Liga (Portugal) Primera Divisi´on (Espa˜ na) Premier League (Inglaterra) Serie A (Italia) Serie A (Italia)

Traducido al lenguaje de nuestro sistema de estudio, los hubs vienen reflejar aquellos 14

equipos que est´an vendiendo o cediendo m´as jugadores, mientras que las autoridades ser´ıan aquellos clubs que reciben, compran o les son cedidos, mayor n´ umero de jugadores. Tampoco hay que confundir los clubes autoridades como aquellos m´as deseados por los jugadores pues, al fin y al cabo, estos no son tan due˜ nos de sus destinos como pueden ser los propios clubes de f´ utbol, con sus din´amicas de compra/venta, regidas por las necesidades econ´omicas, t´ecnicas, y dem´as, de cada equipo. Entonces, seg´ un los datos obtenidos, encontramos que el Parma FC es el equipo con mayor nivel de hub y de autoridad; se diferencia del resto con un grado k = 70, grado de entrada kin = 35 y grado de salida kout = 35 (como ya hemos visto). A resaltar tambi´en el hecho de que un n´ umero importante de equipos que encabezan ambas listas pertenecen a la Serie A, la primera divisi´on italiana. A´ un as´ı, para determinar la importancia de determinados nodos hay que profundizar y llevar a cabo medidas sobre la centralidad. Encontramos muchos equipos italianos que parecen favorecer la movilidad de jugadores en la red pero esto no tiene porqu´e significar que sean nodos centrales en una red europea o mundial, sino que puede ser resultado de una clustering entre equipos propiamente italianos (que es lo que los datos de fichajes recabados sugieren).

2.6 Centralidad. La centralidad es una medida de la importancia de un nodo en la red. Algunas de estas medidas involucran el manejo de m´etricas relativas a la distancia, que no se han incluido en la secci´on pertinente, que inclu´ımos ahora. Existen diferentes aproximaciones para cuantificar la vaga definici´on de centralidad. Con Gephi se han computado las siguientes medidas de centralidad: centralidad de autovector, centralidad de intermediaci´on, y centralidad de cercan´ıa. La centralidad de autovector funciona de la siguiente manera: Esta m´etrica asigna puntuaciones relativas a todos los nodos de la red bas´andose en el concepto de que las conexiones a nodos con puntuaciones m´as altas contribuyen m´as a la puntuaci´on del nodo en cuesti´on que las conexiones a nodos con baja puntuaci´on. As´ı pues, no es suficiente con meramente calibrar la popularidad de un nodo bas´andonos en su grado, sino que debemos tambi´en considerar la popularidad de sus vecinos. Esta es la idea que subyace a la centralidad del autovector. La distribuci´on de centralidad del autovector normalizada obtenida para la red de fichajes es la que muestra la figura 12. En la tabla a continuaci´on se muestran los nodos que poseen una centralidad de autovector m´as elevada:

15

Equipo Parma FC AS Roma Sampdoria Chievo Verona Juventus Atalanta Hellas Verona ACF Fiorentina SSC Napoli Pescara Calcio Torino FC Genoa CFC Udinese Calcio Internazionale FC Bari 1908

Liga (pa´ıs) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia) Serie A (Italia)

Categor´ıa Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera

Centralidad de autovector 1 0.989 0.9 0.785 0.776 0.775 0.745 0.714 0.704 0.688 0.643 0.631 0.618 0.614 0.613

El alto grado de hub y de autoridad del Parma FC respecto al resto de clubes, unido al hecho de que los equipos con los que se relaciona (mayormente italianos) tengan tambi´en un grado elevado, hace que el Parma FC encabece con un 1 la lista de los equipos con mayor centralidad de autovector. V´ease que el dominio de los equipos italianos aqu´ı es devastador, perteneciendo todos los aqu´ı listados (y muchos de los que seguir´ıan) a la Serie A italiana. La centralidad de intermediaci´ on, o centralidad betweeness, surge como una alternativa a considerar el grado del nodo como la u ´nica medida de la importancia de tal nodo en la red. M´as concretamente, los nodos que tienen una alta probabilidad de ocurrencia a la hora de elegir aleatoriamente el camino m´as corto entre dos nodos se

16

dicen que tienen una alta centralidad betweenness o de intermediaci´on. Formalmente, la centralidad de un nodo i se define como la suma de los caminos geod´esicos entre dos nodos s y t v´ıa i, expresada como una fracci´on del n´ umero total de caminos geod´esicos entre s y t. La distribuci´on de la centralidad de intermediaci´on obtenida es la dada en la figura 13.

En la tabla a continuaci´on se muestran los nodos que poseen una centralidad de intermediaci´on m´as elevada: Equipo Liverpool FC SL Benfica Parma FC Chelsea FC Valencia CF FC Porto AS Monaco Sevilla FC Sporting Braga Manchester United Udinese Calcio AS Roma Juventus Rubin Kazan Rayo Vallecano

Liga (pa´ıs)

Categor´ıa

Premier League (Inglaterra) Primeira Liga (Portugal) Serie A (Italia) Premier League (Inglaterra) Primera Divisi´on (Espa˜ na) Primeira Liga (Portugal) Ligue 1 (Francia) Primera Divisi´on (Espa˜ na) Primeira Liga (Portugal) Premier League (Inglaterra) Serie A (Italia) Serie A (Italia) Serie A (Italia) Premier League (Rusia) Primera Divisi´on (Espa˜ na)

Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera

Centralidad de intermediaci´on (norm.) 0.031 0.03 0.03 0.029 0.028 0.024 0.024 0.024 0.023 0.023 0.023 0.023 0.022 0.02 0.02

Entonces, seg´ un lo explicado, los valores asociados a la centralidad de intermediaci´on 17

de estos equipos nos informan de la frecuencia con la que un nodo, un equipo, aparece en el camino m´as corto entre equipos de la red. Ahora vemos un panorama completamente diferente. De las primeras posiciones en medidas de centralidad han desaparecido la gran mayor´ıa de equipos italianos. El Parma FC sobrevive en la tercera posici´on y con un valor muy pr´oximo al del Liverpool FC, y luego encontramos a alg´ un equipo italiano m´as en posiciones m´as bajas, pero han entrado muchos equipos que antes no figuraban con una puntuaci´on tan alta en la medida de centralidad de autovector. Estos resultados apoyan la tesis de que la Serie A, la liga italiana, poseyendo un gran volumen de migraciones de jugadores, tales transferencias tienden a producirse entre los propios equipos italianos y las importaciones/exportaciones de jugadores fuera del pa´ıs carecen de tanta importancia, pero ello ya no son equipos tan centrales en una red global. La Serie A parece altamente conectada entre s´ı y m´as aislada respecto al resto. El equipo con mayor centralidad de intermediaci´on es el Liverpool FC con 0.031, un valor realmente muy bajo, teniendo en cuenta que los resultados est´an normalizados. Esto puede sugerir que aunque juegue un papel importante en esta medida, su papel no es cr´ıtico en t´erminos de la centralidad de intermediaci´on, y la eliminaci´on de algunos de estos nodos podr´ıa no afectar significativamente a la movilidad de jugadores en toda la red. V´ease que, de entre las ocho ligas europeas, aparecen equipos de las ligas inglesa, portuguesa, e italiana, en los puestos m´as altos, con un par de equipos espa˜ noles, uno franc´es, y uno ruso; la liga holandesa y alemana, por contra, no consiguen meter a ning´ un miembro en los puestos altos de centralidad de intermediaci´on. Por u ´ltimo, usamos la centralidad de cercan´ıa, que emplea no solo los vecinos de un nodo, para determinar la centralidad, sino los vecinos de los vecinos. Los nodos que no est´an directamente conectados con el nodo en cuesti´on reciben un peso menor debido a que la intensidad de su interacci´on o influencia es claramente inferior. Formalmente, la centralidad de cercan´ıa es una medida de la distancia media desde un nodo dado i a todos los otros nodos. La distribuci´on de la centralidad de cercan´ıa obtenida es la dada en la figura 14. En la tabla a continuaci´on se muestran los nodos que poseen una centralidad de cercan´ıa m´as elevada:

18

Equipo 1. FC K¨oln LOSC Lille Sibir Novosibirsk FK Mladost Podgorica Shinnik Yaroslavl FC Ufa Mordovia Saransk Baltika Kaliningrad FK Ural Pogon Szczecin Borac Banja Luka Metalurh Donetsk Roda JC Kerkrade SKA-Energia Khabarovsk

Liga (pa´ıs)

Categor´ıa

Bundesliga (Alemania) Ligue 1 (Francia) FNL (Rusia) First League (Montenegro) FNL (Rusia) Premier League (Rusia) Premier League (Rusia) FNL (Rusia) Premier League (Rusia) Ekstraklasa (Polonia) Premier League (Bosnia-Herzegovina) Premier League (Ucrania) Eerste Divisie (Holanda) FNL (Rusia)

Primera Primera Segunda Primera Segunda Primera Primera Segunda Primera Primera Primera Primera Segunda Segunda

Centralidad de cercan´ıa (norm.) 1 1 1 1 1 1 1 0.75 0.75 0.667 0.667 0.667 0.667 0.667

Obtenemos un resultado notablemente diferente con respecto a las previas medidas de importancia y centralidad. Aunque pudiera resultar extra˜ no, hay que saber que, t´ıpicamente, los nodos con mayores valores de centralidad de cercan´ıa no tienen por qu´e ser nodos importantes o cr´ıticos en un sentido general o global, sino que pueden tener su importancia limitada a una comunidad local. El elevado n´ umero de equipos de las ligas rusas, m´as otros equipos relativos a Europa oriental, puede ser un indicativo del aislamiento y concentraci´on de movimientos de jugadores dentro de Rusia y con otras regiones pr´oximas. A la cabeza de la lista, entre otros, tambi´en est´an el FC K¨oln, y el LOSC Lille, esto denota que pueden juegan un papel central en sus respectivas comunidades. El primero comprender´ıa gran parte de los equipos alemanes, conectado hasta ocho de estos y, adem´as, enlaza con el Chelsea FC ingl´es, con grado total k = 31; 19

el segundo, no parece tan angular en su entorno franc´es pero su importancia dentro de Francia radica en su conexi´on con el SC Bastia, con grado total k = 20, que enlaza a diversas partes del globo. Adem´as, conecta tambi´en con equipos importantes y centrales de la Premier League: Liverpool FC, con k = 34, y Manchester City, con k = 15. Una muestra de c´omo cambia la importancia en esta medida de los nodos de la red es compararla con los resultados del c´omputo desechando la red como un grafo dirigido, entonces se tiene que Equipo AS Monaco Valencia CF FC Porto Liverpool FC Chelsea FC SL Benfica Manchester United Sevilla FC AC Milan Juventus Borac Banja Luka Metalurh Donetsk Roda JC Kerkrade SKA-Energia Khabarovsk SKA-Energia Khabarovsk

Liga (pa´ıs)

Categor´ıa

Ligue 1 (Francia) Primera Divisi´on (Espa˜ na) Primeira Liga (Portugal) Premier League (Inglaterra) Premier League (Inglaterra) Primeira Liga (Portugal) Premier League (Inglaterra) Primera Divisi´on (Espa˜ na) Serie A (Italia) Serie A (Italia) Premier League (Bosnia-Herzegovina) Premier League (Ucrania) Eerste Divisie (Holanda) FNL (Rusia) FNL (Rusia)

Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Primera Segunda Segunda Segunda

Centralidad de cercan´ıa (norm.) 0.355 0.353 0.349 0.348 0.348 0.347 0.346 0.344 0.344 0.341 0.34 0.338 0.337 0.334 0.334

As´ı, olvid´andonos de las relaciones de importaci´on/exportaci´on, y centr´andonos en el movimiento general, los equipos que presentan un mayor nivel de centralidad de cercan´ıa son equipos de primer o alto nivel de las principales ligas europeas, y principalmente de la Premier League inglesa, la Primeira Liga portuguesa, la Ligue 1 francesa y la Primera Divisi´on espa˜ nola.

2.7 Modularidad. La modularidad es una medida de las estructura del propio grafo. El objetivo de esta medida es ver c´omo de dividida est´a la red en m´odulos (tambi´en denominados grupos, clusters o comunidades). Las redes con alta modularidad tienen conexiones densas entre los nodos dentro de un mismo m´odulos, pero dispersas entre nodos hallados en diferentes m´odulos. Usamos el algoritmo de detecci´on de comunidades por defecto en Gephi, en modo aleatorio, utilizando los pesos de las conexiones y con una resoluci´on de 1.0. Obtenemos la siguiente distribuci´on de tama˜ no de comunidades (figura 15): 20

Y ahora una imagen de la red diferenciado las distintas clases de modularidad, figura 16:

Encontramos hasta ocho clases de modularidad, que aproximadamente se corresponden con las ocho ligas principales que hemos estudiado. La clase de modularidad 7 integra a los equipos de Rusia m´as algunos equipos de ligas de pa´ıses geogr´aficamente pr´oximos (Ucrania, Polonia, Bulgaria, Bielorrusia, Azerbay´an, etc.) Esto demuestra un fuerte clustering y una muy buena diferenciaci´on en la red de la liga rusa. Con clase de modularidad 6 se encuentran pr´acticamente todos los clubes portugueses. La clase de 21

modularidad 5 recoge principalmente a los equipos holandeses. Si bien, hay que tener en cuenta que las fronteras no est´an claramente diferenciadas, y en cada m´odulo distinguido aparecen equipos de otras de las ligas principales o equipos de ligas menores. La clase 4 recoge a los equipos franceses; la 3 al grueso de los ingleses; la 2 a los alemanes; la 1 a los italianos; y la 0 a los espa˜ noles. Esta medici´on da cuenta del clustering de cada liga en la contrataci´on o movimiento de jugadores entre clubes: la tendencia o el mayor volumen de movimiento de jugadores se produce, en mayor o menor medida seg´ un la liga o pa´ıs, dentro de las fronteras del mismo.

3 Resumen y conclusiones. En esta tarea el objetivo era, a partir de bases de datos, analizar una red compleja mediante un programa propio o especializado para tal labor. He preferido aportar un toque de originalidad y crear yo mismo una red. Tras varios intentos infructuosos sobre diversas tem´aticas o fen´omenos, encontr´e interesante y sencilla de elaborar una red que registrara los fichajes de los clubes de f´ utbol acaecidos en el mercado de verano 2014/2015. La labor de recabar datos ha sido laboriosa pero la confecci´on o definici´on de la red no ha presentado complicaciones. Tenemos un grafo pesado y dirigido seg´ un la transferencia o movimiento del jugador entre dos equipos de f´ utbol. El an´alisis ha sido llevado a cabo mediante el programa Gephi. Algunas medidas caracter´ısticas de la red obtenidas han sido: Red: Distribuci´on de grado p(k) = Grado medio hki = Longitud de camino medio ` = Coeficiente de clustering Cdirected =

Fichajes (8 ligas) 14/15 k −1.42 2.63 4.524 0.058

A falta de otros resultados en este ´ambito no podemos realizar, desgraciadamente, comparaciones expl´ıcitas. Estos resultados muestran que la red de fichajes no se ajusta a un modelo Erd¨os-Renyi; ni, en principio, a una red peque˜ no-mundo: la longitud de camino medio podr´ıa encajar bien pero el coeficiente de clustering (incluso en el caso sin dirigir) es demasiado bajo. Y recordemos la matizaci´on anterior: no podemos concluir definitivamente que la red de fichajes 2014/2015 en t´erminos globales siga una ley de potencias por falta de datos recabados acerca de gran parte de los nodos involucrados en la red. Sin embargo, este comportamiento potencial se ve para una parte de la distribuci´on si nos limitamos a la consideraci´on de las ocho ligas principales europeas. Algunos aspectos para trabajar en el futuro sobre este sistema ser´ıa realizar una recopilaci´on de datos m´as completa acerca de un mayor n´ umero de nodos, profundizar en el detalle de un mayor n´ umero de ligas posibles para clarificar algunos comportamientos. Tambi´en podr´ıamos analizar los resultados obtenidos (longitud de camino medio, coeficiente 22

de clustering, distribuci´on de grado) liga por liga para ver el comportamiento por cl´ uster. Otro aspecto interesante a estudiar ser´ıa ver la evoluci´on din´amica de este mercado a lo largo del tiempo, por ejemplo de aqu´ı a los u ´ltimos 30 a˜ nos: la apertura del mercado y la internacionalizaci´on (o globalizaci´on) de los movimientos es un hecho insoslayable y seguramente ser´ıamos testigos de una p´erdida de aislamiento y una mayor apertura del mercado en todas las direcciones.

Список литературы [1] R´eka Albert, Albert-L´aszlo Barab´asi, Statistical Mechanics of Complex Networks [2] L. da F. Costa, F.A. Rodrigues, G. Travieso, P.R. Villas Boas, Characterization of Complex Networks: A survey of measurements [3] Rishabh Poddar, Mayank Shrivastava, Complex Network Theory. Lecture notes [4] http://www.worldfootball.net/ [5] http://en.wikipedia.org/wiki/List_of_top-division_football_clubs_in_ UEFA_countries [6] https://gephi.github.io/

23

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.