Aller au contenu

Jeux & singularité : go


Messages recommandés

1)c4 ,l'anglaise, je ne l'ai jamais joué. J'ai sorti l'échiquier, je remarque de suite que ça va permettre de développer le cavalier sans bloquer le pion c et en mettant la grosse pression sur d5. C'est aussi une ouverture à la mode chez les humains ?

Lien vers le commentaire

Je dirais oui, par exemple Aronian à l'air de pas mal l'utiliser.

Si tu comprends pas trop mal l'anglais un youtubeur qui commente des parties d'échecs a analysé quelques unes des partie publiées par Google en voici une.

 

Le moment qui a vraiment secoué le monde du machine learning, c'est la compétition sur ImageNET, ILSVRC de 2012. Où l'équipe d'Alex Krizhevsky en obtenant un score de 16% d'erreur vs 26% pour les meilleurs mondiaux a finalement démontré une vraie percée en utilisant un réseau de neurones convolutif.

 

Lien vers le commentaire

Non sans doute, par contre en peu de temps l'IA vient de rendre un fier service aux humains en réhabilitant l'audace et la stratégie face aux tactiques fade des moteurs type Stockfish.

Par contre pour savoir si un grand maître est capable d'être assez précis pour adopter ce genre de stratégie, mystère.

Lien vers le commentaire

En me renseignant sur l'anglaise il paraît que celle jouée par Bobby Fisher contre un russe aux championnat du monde est un summum de précision , le russe abandonne , se lève et applaudit Fisher , qui paraît il en dehors des échecs ne payait pas de mine.

Lien vers le commentaire
  • 2 weeks later...

Extension du domaine des IA : https://usbeketrica.com/article/google-search-jusqu-aux-etoiles

Quote

En s’associant avec succès avec la NASA, les IA font montre de leur potentiel incroyable en découvrant ce que les chercheurs n'ont pas su trouver. Avides de données à partir desquelles les réseaux neuronaux s’entraînent à remplir une mission, ils ont fini par croiser la route de l’astronomie, pour le plus grand bonheur des chercheurs qui peuvent compter sur leur aide précieuse pour analyser notre univers, donnée après donnée. Jusqu’à découvrir la trace de la présence de la moindre planète, même à 2500 années-lumière de la Terre.

 

  • Yea 1
Lien vers le commentaire
Just now, Mathieu_D said:

Pour le coup cette application en particulier n'est pas specialement impressionnante. (détecter des baisses de luminosité régulière des étoiles en automatique)

À mon avis elle annonce bien ce qui va suivre : je pense qu'un des domaines de prédilection de l'IA sera la fouille de données massives. TRACFIN doit en faire des rêves humides la nuit

  • Yea 2
Lien vers le commentaire
1 hour ago, Kassad said:

À mon avis elle annonce bien ce qui va suivre : je pense qu'un des domaines de prédilection de l'IA sera la fouille de données massives. TRACFIN doit en faire des rêves humides la nuit

La DGFIP a déjà des presta en détection de fraude. (heureusement je n'ai pas été sur cette mission dans mon ancienne boîte...)

Lien vers le commentaire
  • 5 months later...
  • 2 months later...

Pour le moment l'humanité tient toujours : https://www.wired.com/story/pro-gamers-fend-off-elon-musks-ai-bots/

 

Quote

Pro Gamers Fend off Elon Musk-Backed AI Bots—for Now

One way to measure progress in artificial intelligence is to chart victories by algorithms over champions of increasingly challenging games—checkers, chess, and, in 2016, Go. On Wednesday, five bots sought to extend AI’s mastery to esports, in the fantasy battle game Dota 2. They failed, as a team of pro gamers from Brazil called paiN defended humanity’s honor—for now.

 

A crowd of thousands in Vancouver’s hockey arena watched the bots battle paiN over 52 tense minutes packed with spells and fire bolts. The humans won decisively. The human-machine contest was a side event to the International, a Dota 2 tournament that boasts the biggest purse in esports, at $25 million.

The five bots that lost Wednesday were created by OpenAI, a research institute cofounded by Tesla CEO Elon Musk to work toward human-level artificial intelligence, and make the technology safe.

 

Lien vers le commentaire

On a parlé un peu dans le topic des jeux vidéos.
Même si je connais peu DotA 2, j'ose croire que j'ai une certaine compréhension des mobas. Du coup, j'en tire la conclusion que l'IA est loin de pouvoir rivaliser avec l'humain, notamment comme le dit l'article parce qu'elle ne comprend pas la macro. (Les conditions pour ce match étaient en faveur de l'IA, vu que le pool de champions disponibles étaient limitées et que certaines fonctionnalités / techniques étaient interdites aux humains). 

Lien vers le commentaire
  • 4 months later...

Il faut que je lise tout ça mais d'un point de vue scientifique Alphastar me paraît plus impressionnant qu'AlphaGo... Je veux dire que pour Alphastar il me semble y avoir de vraies nouveautés scientifiques (pour AlphaGo c'était du bon vieux Monte-Carlo tree search + Deep learning : des algos qui ont plus de 20 ans d'existence, c'était juste une bonne exploitation d'idées connues).

 

La page de Deepmind sur leur dernier bébé https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/

Lien vers le commentaire

Hé bien c'etait en toute honnêteté intéressant, mais absolument pas équilibré d'un point de vue joueur / machine.

 

Soyons clair: Si le but est de faire gagner l'ordinateur (car on parle bien d'une compétition homme / machine) il suffit dans l'absolu de faire tricher la machine. donc on permet par exemple à la machine de regarder le plateau entier, dans un jeu ou le joueur ne peut pas le faire ...  et c'est exactement ce que deepmind fait avec Alphastar. Deepmind a beau mettre des "gardes fous" pour équilibrer le combat, il est un fait après visionnage qu'Alphastar n'en avait cure.

 

Prenons plusieurs exemple:

- Alphastar ne joue pas à travers un écran, mais a travers une image mémorielle de l’entièreté de la carte. Quel joueur humain se rappelle en tout temps de la dernière localisation de tous les éléments visible de la carte ?

- Alphastar est cappé en action par minute 'moyenne' , à environ 300 APM. Mais quelle supercherie de la part d’ingénieurs en machine learning. Se faire avoir par la moyenne d'une distribution d'actions sur 10 minutes, c'est intellectuellement scandaleux. Alphastar a joué avec une moyenne de 300 APM dont le replay montre clairement qu'il jouait a 50 les 5 premières minutes et 800 les dernières. C'est potentiellement comparable, mais les écarts sont trop importants, les joueurs ne dépassent pas 500/600 plus de quelques secondes.

- ... Ce qui de toute façon ne change rien, car Alphastar ne se trompe pas dans ses décisions. Un pro joue en moyenne a 300 APM dont une grande partie est due à la compensation de ses échecs de micro décisions ('"je voulais aller là, .. ha non plutôt là... oups j'ai pas super bien cliqué"). Alphastar clique exactement la ou il le souhaite, sa souris ne glisse pas à côté par erreur. Se déplacements sont d'une fluidité formidable.

- Alphastar sélectionne proprement son clic, mais aussi l'interface dans lequel il clique. ce qui lui permet par exemple de jouer sur trois fronts, car il positionne sa caméra (et sa mémoire) avec une compréhension qui se situe au dela du cadre, et au dela du réflexe. Ce qui a été vu quelques fois en match pro sur des millions de parties ... et 1 sur 5 dans ce showmatch. Et encore, ne comptons pas qu'ALphastar, et les commentateurs en etaient effrayés, ne "respecte" pas le terrain. ON attaque pas d'en bas d'une colline si on ne voit pas ce qu'il y a en haut... sauf Alphastar , qui se rappelle ce qu'il y a en haut d'un coup d'oeil :p

- Enfin et c'est certainement le pire, Alphastar a un super pouvoir. Il peut cliquer une par une un pack de 80 unités pour les déplacer au bon moment... et il ne se gêne pas: prenons une unité avec une téléportation et 6(unités de distance) de portée,  Alphastar approche son unité a 6 pile, tire, et se téléporte dès qu'il voit une unité de portée équivalente arriver. De plus les unités ayant un niveau de vie, il privilégie les téléportations des unités handicapées. C'est très humain comme comportement (préservation des ressources), et à faible nombre d'unité ça se gère (comprendre que les humains arrivent à sentir cette capacité sur 3 à 4 groupes d'unités quand le front de combat est simplement déterminé). Alphastar a déplacé 80 unités indépendamment sur 3 fronts sans prendre de tirs adversaire. On est la clairement dans un biais homme/machine qui n'est pas intelligent, mais capacitif. Et alphastar ne s'y est pas trompé: après avoir joué des millions de parties, il a simplement déterminé que ce jeu pouvait se gagner avec un seul type d'unité ( SC2 en comporte environ 12 par race) s'il la jouait très bien, et il a choisit le stalker, seule unité tirant de loin, et dans tous les axes, et se déplacant vite, soit l'unité la plus versatile du set. On a lui a vu (trait d'intelligence certain) y ajouter un "bouclier"  en créant la seconde unité utile du jeu: le détecteur d'unité invisibles, seule limitation du stalker, qui permettra au stalker d'être sûr de tout dégommer.

On pourra donc résumer que pour l'instant Alphastar a compris qu'on pouvait lier une stratégie gagnante à une meilleure éxécution que son adversaire.

Un bon pas pour l'IA, mais un intérêt discutable pour une confrontation humain/machine... En gros on fait jouer excel contre cédric vilani à "qui c'est qui fait le plus vite une addition de 200 nombres à 8 chiffres ?"

... ET Mana, le joueur Pro protoss, ne s'y est pas trompé non plus: fort de sa première défaite et d'une analyse qui n'a pas nécéssité 50 ingénieurs google,  il a utilisé les mêmes règles au match retour: faire bugger l'IA là ou sa compréhension du jeu est faible(créer un leurre offensif) , la jouer toutes les 30 secondes, et en profiter pour avoir une supériorité ecrasante pendant que l'IA est occupée à bugger. Bravo, c'est une stratégie qu'utilisent TOUT les débutants contre l'IA starcraft  officielle depuis ... 19 ans :p



Il y a quand même du positif à retenir de ce match:

- Clairement Alphastar a compris les règles, et la mécanique générale du jeu.

- Il a aussi fait preuve d'une stratégie intéressante, continuellement et qui n'a JAMAIS été vu dans le jeu en 20 ans: il crée TOUJOURS un surplus d'unités dédié à la gestion des ressources (dans Starcraft il faut d'abord miner du minerai avant de l'utiliser, il est estimé que l'optimum est à 16 récolteurs par base) car Alphastar fait presque 30 récolteurs par base : On y a donc appris qu'Alphastar n'est jamais en défaut de ressources quand l'adversaire attaque ses récolteurs car il en a toujours plus que nécessaire. De plus, Alphastar transfère tous les récolteurs en surplus sur une seconde base dès qu'elle est crée, ce qui crée un bond de ressources, au lieu d'une montée linéaire.  Et clairement Alphastar semble avoir un bon taux de ressources globale, car il était souvent en surnombre d'unité d'attaques: On peut donc en tirer que contrairement à la croyance populaire "il n'y a pas de livret A dans starcraft" .. et bien il y en a un ! Si on investit de l'argent dans les récolteurs, on épargne son économie future pour quand l'adversaire tuera des récolteurs.

  • Post de référence 3
Lien vers le commentaire

En fait et pour résumer, le problème de StarCraft comparé aux jeux traditionnels (échecs, go etc), c'est qu'il y a une dimension mécanique (au sens physique, bouger ses doigts en temps réel, percevoir des formes/couleurs dans des laps de temps très courts etc) qui fait qu'on ne compare pas seulement des intellects abstraits. Donc que signifierait exactement, dans ces conditions, qu'une IA a dépassé un joueur humain ?

Je ne sais pas trop, en fait...

Lien vers le commentaire

Exactement. Le problème de la comparaison homme /machine dans des jeux qui ont une dimension mécanique, c'est qu'il y a forcément un écart capacitif gigantesque à plugger une machine directement sur l'interface. Les palliatifs du type "oui mais on l'a cappé pour pas que ça clique trop vite" sont juste des arguments risibles pour ne pas frustrer les spectateurs désireux de voir se dérouler le combat.

Et même si à la limite on programmait une IA qui devait simuler un comportement humain dans son approche de l'interface, il faudrait, pour être équilibré, simuler la faible capacité de précision d'un humain, dans son approche physique et mentale de résolution d'un problème. (Ici, ma main a une précision physique médiocre ET je me rappelle pas de tout le nécéssaire décisionnel ET je ne m'apperçois pas de tous les détails pertinents ET mon raisonnement a une portée temporelle très faible si j'ai 10 trucs à faire à la seconde)

On sent donc que finalement ce genre de match n'ont aucun sens dans le sens machine vers homme, et en extrapolant, cela n'avait peut être déjà aucun intérêt dès les essais sur les Echecs. On souhaite voir si on peut coller au raisonnement humain, et on découvre que les humains ne faisant pas de baysianisme automatique dans leur approche de chaque problème, il n'y a aucune raison de mettre en œuvre un adversaire qui le fait pour espérer avoir un combat loyal dérrière. On compare juste des choux et des astronautes. 


Par contre dans l'autre sens, il semblerait que la désir des humains à continuer à se sentir supérieur aux machines drive le business, et justifie le developpement IT par le désir du jeu. Donc quand la machine est plus faible, c'est parce qu'on est plus intelligent, et quand la machine est plus forte, c'est parce qu'elle utilise des capacités inaccessible aux humains. Well, that was interesting. Ergo, pour du spectacle c'est génial, et quand les ordis battront toujorus les humains, il y aura toujours un spectacle IA/IA qui aura du succès, c'est toujours ça de gagné.

Bref, on est toujours aussi loin de l'intelligence artificielle, par contre on a un nouveau jouet pour résoudre des problèmes a portée calculatoire trop complexes ou répétitives pour un humain. La technique d'apprentissage par renforcement a l'air de réaliser des exploits en terme de choix comparatifs pour tendre vers un objectif.  Reste à connaître l'objectif :p

  • Post de référence 1
Lien vers le commentaire
  • 5 months later...
  • 2 weeks later...
On 1/26/2019 at 12:51 PM, Prouic said:

Hé bien c'etait en toute honnêteté intéressant, mais absolument pas équilibré d'un point de vue joueur / machine.

 

Soyons clair: Si le but est de faire gagner l'ordinateur (car on parle bien d'une compétition homme / machine) il suffit dans l'absolu de faire tricher la machine. donc on permet par exemple à la machine de regarder le plateau entier, dans un jeu ou le joueur ne peut pas le faire ...  et c'est exactement ce que deepmind fait avec Alphastar. Deepmind a beau mettre des "gardes fous" pour équilibrer le combat, il est un fait après visionnage qu'Alphastar n'en avait cure.

 

Prenons plusieurs exemple:

- Alphastar ne joue pas à travers un écran, mais a travers une image mémorielle de l’entièreté de la carte. Quel joueur humain se rappelle en tout temps de la dernière localisation de tous les éléments visible de la carte ?

- Alphastar est cappé en action par minute 'moyenne' , à environ 300 APM. Mais quelle supercherie de la part d’ingénieurs en machine learning. Se faire avoir par la moyenne d'une distribution d'actions sur 10 minutes, c'est intellectuellement scandaleux. Alphastar a joué avec une moyenne de 300 APM dont le replay montre clairement qu'il jouait a 50 les 5 premières minutes et 800 les dernières. C'est potentiellement comparable, mais les écarts sont trop importants, les joueurs ne dépassent pas 500/600 plus de quelques secondes.

- ... Ce qui de toute façon ne change rien, car Alphastar ne se trompe pas dans ses décisions. Un pro joue en moyenne a 300 APM dont une grande partie est due à la compensation de ses échecs de micro décisions ('"je voulais aller là, .. ha non plutôt là... oups j'ai pas super bien cliqué"). Alphastar clique exactement la ou il le souhaite, sa souris ne glisse pas à côté par erreur. Se déplacements sont d'une fluidité formidable.

- Alphastar sélectionne proprement son clic, mais aussi l'interface dans lequel il clique. ce qui lui permet par exemple de jouer sur trois fronts, car il positionne sa caméra (et sa mémoire) avec une compréhension qui se situe au dela du cadre, et au dela du réflexe. Ce qui a été vu quelques fois en match pro sur des millions de parties ... et 1 sur 5 dans ce showmatch. Et encore, ne comptons pas qu'ALphastar, et les commentateurs en etaient effrayés, ne "respecte" pas le terrain. ON attaque pas d'en bas d'une colline si on ne voit pas ce qu'il y a en haut... sauf Alphastar , qui se rappelle ce qu'il y a en haut d'un coup d'oeil :p

- Enfin et c'est certainement le pire, Alphastar a un super pouvoir. Il peut cliquer une par une un pack de 80 unités pour les déplacer au bon moment... et il ne se gêne pas: prenons une unité avec une téléportation et 6(unités de distance) de portée,  Alphastar approche son unité a 6 pile, tire, et se téléporte dès qu'il voit une unité de portée équivalente arriver. De plus les unités ayant un niveau de vie, il privilégie les téléportations des unités handicapées. C'est très humain comme comportement (préservation des ressources), et à faible nombre d'unité ça se gère (comprendre que les humains arrivent à sentir cette capacité sur 3 à 4 groupes d'unités quand le front de combat est simplement déterminé). Alphastar a déplacé 80 unités indépendamment sur 3 fronts sans prendre de tirs adversaire. On est la clairement dans un biais homme/machine qui n'est pas intelligent, mais capacitif. Et alphastar ne s'y est pas trompé: après avoir joué des millions de parties, il a simplement déterminé que ce jeu pouvait se gagner avec un seul type d'unité ( SC2 en comporte environ 12 par race) s'il la jouait très bien, et il a choisit le stalker, seule unité tirant de loin, et dans tous les axes, et se déplacant vite, soit l'unité la plus versatile du set. On a lui a vu (trait d'intelligence certain) y ajouter un "bouclier"  en créant la seconde unité utile du jeu: le détecteur d'unité invisibles, seule limitation du stalker, qui permettra au stalker d'être sûr de tout dégommer.

On pourra donc résumer que pour l'instant Alphastar a compris qu'on pouvait lier une stratégie gagnante à une meilleure éxécution que son adversaire.

Un bon pas pour l'IA, mais un intérêt discutable pour une confrontation humain/machine... En gros on fait jouer excel contre cédric vilani à "qui c'est qui fait le plus vite une addition de 200 nombres à 8 chiffres ?"

... ET Mana, le joueur Pro protoss, ne s'y est pas trompé non plus: fort de sa première défaite et d'une analyse qui n'a pas nécéssité 50 ingénieurs google,  il a utilisé les mêmes règles au match retour: faire bugger l'IA là ou sa compréhension du jeu est faible(créer un leurre offensif) , la jouer toutes les 30 secondes, et en profiter pour avoir une supériorité ecrasante pendant que l'IA est occupée à bugger. Bravo, c'est une stratégie qu'utilisent TOUT les débutants contre l'IA starcraft  officielle depuis ... 19 ans :p



Il y a quand même du positif à retenir de ce match:

- Clairement Alphastar a compris les règles, et la mécanique générale du jeu.

- Il a aussi fait preuve d'une stratégie intéressante, continuellement et qui n'a JAMAIS été vu dans le jeu en 20 ans: il crée TOUJOURS un surplus d'unités dédié à la gestion des ressources (dans Starcraft il faut d'abord miner du minerai avant de l'utiliser, il est estimé que l'optimum est à 16 récolteurs par base) car Alphastar fait presque 30 récolteurs par base : On y a donc appris qu'Alphastar n'est jamais en défaut de ressources quand l'adversaire attaque ses récolteurs car il en a toujours plus que nécessaire. De plus, Alphastar transfère tous les récolteurs en surplus sur une seconde base dès qu'elle est crée, ce qui crée un bond de ressources, au lieu d'une montée linéaire.  Et clairement Alphastar semble avoir un bon taux de ressources globale, car il était souvent en surnombre d'unité d'attaques: On peut donc en tirer que contrairement à la croyance populaire "il n'y a pas de livret A dans starcraft" .. et bien il y en a un ! Si on investit de l'argent dans les récolteurs, on épargne son économie future pour quand l'adversaire tuera des récolteurs.

Ok t'es en train de nous faire un bon argumentaire genre : si on laisse les capacités de chacun s'exprimer, l'humain est une merde.
Ce qui est honteux c'est qu'on bride l'IA, qui ne peut donc pas montrer toute la splendeur de la merditude de l'être humain.

 

Lien vers le commentaire

C'est absurde, ce jugement n'a strictement aucun sens. Le jeu a été conçu d'une certaine façon pour des humains et leurs limitations, que l'ia n'a pas (par construction elle n'a pas besoin de la même interface pour jouer). C'est comme dire qu'un humain est une grosse merde parce qu'il va moins vite qu'une voiture sur une autoroute...

(Je suis sûr que quelqu'un trouvera une image encore plus parlante)

  • Yea 1
Lien vers le commentaire

je suis d'accord avec boz.

 

La question de base c'est pas de savoir si on peut voir des démonstrations machine pertinentes pour le jeu, car c

ça on le sait déjà, et on a même pas besoin de machine learning, il y a des scripts dans les jeux de stratégie depuis 30 ans. On veut savoir si une machine avec ML peut gagner un humain de haut niveau sur un jeu de stratégie, car ce n'est pas le cas des scripts actuels.

Déjà les humains eux même ont un biais puisqu ils ne jouent pas tous les jours avec un meilleur niveau que la veille. Mais surtout si tu debrides la machine sur sa capacité mécanique, pourquoi 3 ans de développement pour apprendre qu'une presse 6 tonnes gagne n'importe quelle compétition d'haltérophilie...

Un match n 'est intéressant pour les joueurs que s'il y a un équilibre relatif durant le match. Je suis nul aux échecs mais si je joue contre mon fils de 4ans ca ne sera captivant ni pour moi, ni pour lui, ni pour aucun spectateur de cette compétition.

 

Donc au mieux dans ton cas Chk , on peut voir 2 IA combattre, mais ca ne prouvera en rien qu'elles ont un niveau suffisant pour une compétition pro.

 

Mon avis c'est plutôt que cet exercice ne  sert à rien, car il faut une simulation de comportement en plus d'une simu d intelligence, ppur avoir un match raisonnablement équilibré.

  • Yea 1
Lien vers le commentaire
  • 5 weeks later...

 

Quote

En même temps, si les règles sont mal foutues...

C'est moi ou c'est écrit pour des non-experts ?

Parce que "overwhelm its own memory", ça à l'air ouf alors qu'il s'agit sans doute d'un bête overflow. Combien de machines ce sont plantées parce qu'un compteur critique était retourné à 0 en pleine action ?

Lien vers le commentaire
Il y a 3 heures, Philiber Té a dit :

En même temps, si les règles sont mal foutues...

Le monde entier est tissé de règles mal foutues, ambigües, ou supposant fortement un contexte précis.

Lien vers le commentaire

Créer un compte ou se connecter pour commenter

Vous devez être membre afin de pouvoir déposer un commentaire

Créer un compte

Créez un compte sur notre communauté. C’est facile !

Créer un nouveau compte

Se connecter

Vous avez déjà un compte ? Connectez-vous ici.

Connectez-vous maintenant
×
×
  • Créer...