Aller au contenu





Photo

Deconnexion Réseau Des Hôtes Esxi

deconnexion hôtes esxi

  • Veuillez vous connecter pour répondre
16 réponses à ce sujet

#1 Saratorn

Saratorn

    Membre

  • Membres
  • PipPip
  • 25 messages

Posté 28/01/2014, 18:04

Bonjour VMUG !!!

 

Je m'heurte à un petit problème aléatoire ("Au saumon !! mon préféré !!") sur mes host Esxi.

 

L'architecture :

 

Un Baldecenter IBM à l'intérieur de quoi se trouve 3 lames.

Donc 3 hosts IBM taillés pour vmware avec la petite clé ESXi 5.1 qui va bien.

Les VMs sont sur un SAN DS3512 connecté en SAS.

Un serveur physique à coté faisant office de Vcenter.

 

Cette architecture sert de PRA (Plan de retour en activité) grace vSphere Replication.

Il n'y a donc qu'une VM de lancé sur une seule lame.

Les autres restent allumé dans le cas d'une panne de la prod.

 

 

Mon problème :

 

- Mes hosts pertent de manière aléatoire leurs connexions réseaux.

- Fréquence : trés aléatoire. Parfois 2 fois dans la semaine, parfois tous les 2 ou 3 mois.

 

 

Ma solution

 

- La seule solution que j'ai trouvé est de me connecter en phisique sur l'host.

- Me loguer en root

- Redémarrer l'interface réseau ( 2 à 3 essais sont nécessaires)

 

 

Ce que je trouve bizarre

 

- Lorsque je me connecte directement sur la machine je constate sur l'écran d'accueil que l'adresse IP affiché est la bonne

- Mais les pings sont impossible.

 

 

 


  • 0

#2 pedro99

pedro99

    Membre actif

  • Membres
  • PipPipPipPip
  • 1 487 messages

Posté 28/01/2014, 20:58

Est ce que ce sont des cartes réseau Broadcom ?
  • 0

#3 roro33

roro33

    Membre confirmé

  • Membres
  • PipPipPip
  • 631 messages
  • LocationParis

Posté 28/01/2014, 22:12

Est ce que ce sont des cartes réseau Broadcom ?

ahahaha t'es un parano des cartes Broadcom  :razz:


  • 0

#4 pedro99

pedro99

    Membre actif

  • Membres
  • PipPipPipPip
  • 1 487 messages

Posté 28/01/2014, 23:01

Elles ne m'ont jamais décu dans les emmerdes :smile:
  • 0

#5 Ouest

Ouest

    Membre actif

  • Membres
  • PipPipPipPip
  • 2 170 messages
  • LocationAuvergne

Posté 28/01/2014, 23:31

Au vue des retours sur le net, en même temps elles n'ont jamais déçu personne dans les emmerdes, d'une régularité exemplaire :D
  • 0

#6 tdesmarest

tdesmarest

    Membre

  • Membres
  • PipPip
  • 26 messages
  • LocationParis

Posté 29/01/2014, 11:03

Bonjour,

 

Est-ce que ce sont tous les ESXi qui perdent leur accès réseau sur toutes les pattes en même temps ou bien est ce un problème qui ne touche qu'une ou plusieurs cartes sur un ou plusieurs ESXi ? -> Essayer d'isoler un composant de l'infra en particulier

 

Est-ce que les ESXi peuvent toujours se pinger entre eux (-> Problème plus haut derrière le bladecenter) ou est ce que les interfaces réseau sont réellement tombées ? (-> Isolation totale de l'ESXi).

 

Avez-vous du Link State Tracking sur votre bladecenter IBM qui pourrait faire tomber la carte réseau des lames parceque lui même a perdu son upstream ? Si oui, avez-vous checké les switches en amont ? Défaillance, Coupure de port pour économie d'energie...

 

Cordialement,


  • 0

#7 shuguet

shuguet

    Membre actif

  • Membres
  • PipPipPipPip
  • 2 623 messages
  • LocationParis

Posté 29/01/2014, 11:19

Modèle du chassis IBM?

Modèle des switchs réseau embarqués?

Modèle des lames ? (21, 22, 22V, 23, autre?)

Niveau de firmware pour tout ces éléments?

 

Pas que je veuille passer pour le support "classique", mais pour avoir ~220 lames IBM de ces 4 modèles dans des BladeCenter H, si tu as des patchs disponibles et que les versions sont supportées par la HCL VMware, fait les ... ces trucs sont plus touchy que du Dell :x

 

Sylvain.


  • 0

#8 woueb

woueb

    Membre confirmé

  • Membres
  • PipPipPip
  • 567 messages
  • LocationMetz / Luxembourg

Posté 29/01/2014, 12:20

Et ton AMM est en quelle version ?

Dépendant cette version, l'adresse IP de l'AMM et l'adressage des ESXi, tu peux avoir un problème de proxy arp du à l'AMM.


  • 0

#9 Saratorn

Saratorn

    Membre

  • Membres
  • PipPip
  • 25 messages

Posté 29/01/2014, 15:04

@Pedro99

 

Est ce que ce sont des cartes réseau Broadcom ?

Oh je sens que ça va te plaire :P

 

Product Name     Broadcom 4 port Ethernet Expansion Card    

Description     Ethernet HSEC    

Part Number     44W4481    

FRU Number     44W4488  

 

@tdesmarest

 

Est-ce que ce sont tous les ESXi qui perdent leur accès réseau sur toutes les pattes en même temps ou bien est ce un problème qui ne touche qu'une ou plusieurs cartes sur un ou plusieurs ESXi ?

- Les ESXi qui perdent leur accès réseau sur toutes les pattes en même temps

 

 

Est-ce que les ESXi peuvent toujours se pinger entre eux (-> Problème plus haut derrière le bladecenter) ou est ce que les interfaces réseau sont réellement tombées ? (-> Isolation totale de l'ESXi).

- Je n'ai pas fait ce test. En effet, je dois pouvoir essayer depuis l'interface de l'Esxi. Je ferais le test à la prochaine panne, bonne idée.

 

 

Avez-vous du Link State Tracking sur votre bladecenter IBM

- Non, pas de Link State Tracking

 

@shuguet

 

Modèle du chassis IBM?

Modèle des switchs réseau embarqués?

Modèle des lames ? (21, 22, 22V, 23, autre?)

Niveau de firmware pour tout ces éléments?

- Chassis : IBM BladeCenter S // Model : 88861TG / PN : 68Y6742

---FMW : Build : BPET62Y / Released : 03/20/2013 / Revision : 62

 

- Switches : BNT Layer 2/3 GB Copper Ethernet Switch Module / PN    32R1866

---Boot ROM / Build : WMZ00005/ Released : 12/31/2069 (oO WTF ?) / Revision : 0503

---Main Application 1/ Build : WMZ00005/ Released : 04/24/2012 / Revision : 0503

---Main Application 2/ Build : WMZ00005/ Released : 04/24/2012 / Revision : 0503

 

- Lames : IBM BladeCenter HS23 // Model : 7875A2G / PN : 00Y4918

---FW/Bios / Build : TKE128RUS / Released : 04/30/2013 / Revision 1.40

---Diagnostics / Build : DSYTB6E / Released : 04/17/2013 / Revision 9.33

---Blade Sys Mgmt Processor / Build : 1AOO40Z

 

 

Pas que je veuille passer pour le support "classique", mais pour avoir ~220 lames IBM de ces 4 modèles dans des BladeCenter H, si tu as des patchs disponibles et que les versions sont supportées par la HCL VMware, fait les ... ces trucs sont plus touchy que du Dell

A l'installation de cette salle PRA, j'ai mis a jours tous le materiel avec le BOMC d'IBM.

Sinon, nous venons de signer un contrat GTMS avec IBM, qui nous assure la prise en charge des mises à jours de nos serveurs en fonction de notre infrastructure.

Donc si c'est un problème à ce niveau là, j'espère bien qu'il le trouverons ...

 

 

@woueb

 

Et ton AMM est en quelle version ?

- C'est étrange, mais je n'arrive pas à trouver la version de l'AMM, désolé de ne pouvoir répondre à cette question.

 

 

 

--------------

 

LOG

 

Sinon j'ai regardé les logs dans l'amm concernant les module I/O 1 et 2 qui correspondent au 2 switchs à l'arriere du Bladecenter.

Et j'ai ça qui correspond aux dates de la panne :

 

20 I IOMod_02 01/25/14 09:05:39 I/O module 2 was instructed to power on.

21 I IOMod_01 01/25/14 09:05:36 I/O module 1 was instructed to power on.

 

--------------

 

EDIT : MERCI DE VOTRE AIDE !!!!! ;-)


Modifié par Saratorn, 29/01/2014, 15:16.

  • 0

#10 tdesmarest

tdesmarest

    Membre

  • Membres
  • PipPip
  • 26 messages
  • LocationParis

Posté 29/01/2014, 15:17

Hum...

 

Si ce sont tous tes ESXi qui perdent toutes les pattes réseau en même temps et qu'en plus tu as aux mêmes heures dans tes logs des messages de "power on" quasi simultanés des IO Module, ça pue le Blade Center qui reboote les IO/Module. Maintenant je ne suis pas du tout un spécialiste IBM donc pour quelle raison cela pourrait-il arriver ?

 

Système d'économie d'énergie foireux ?

Un plantage (dans le même style que celui qui affecte les cartes E1000) des IO Module qui oblige l'AMM à les rebooter ?

Ton contrat GTMS IBM qui pousse les mecs à venir mettre à jour les firmwares et rebooter sans même te prévenir ? :shock:  :doh: :D (Si si, déjà vu en vrai)

 

Peut-être un call au support IBM t'ouvrira t'il les voies majestueuses du "know issue"  :smile:


  • 0

#11 shuguet

shuguet

    Membre actif

  • Membres
  • PipPipPipPip
  • 2 623 messages
  • LocationParis

Posté 30/01/2014, 12:33

BladeCenter S...

C'est bien le truc tout en 1 avec disques + lames dans le même châssis ?

Si oui, ne cherche pas plus loin, je n'ai eu que des emmerdes avec.

Chez un client, on à mis en standby un projet pendant 1 ans à cause de ces châssis.

Le taux de pannes du châssis/lames/switch était du jamais vu.

 

BladeCenter E, H, HT si tu veux, mais S :'(

 

Ouvre un case chez IBM, si un tech passe réparer, discute avec lui... il y a quelques années ils étaient eux même plus que critique sur ce modèle.

 

Sylvain.


  • 0

#12 Saratorn

Saratorn

    Membre

  • Membres
  • PipPip
  • 25 messages

Posté 30/01/2014, 17:57

@tdesmarest

 

 

Système d'économie d'énergie foireux ?

Un plantage (dans le même style que celui qui affecte les cartes E1000) des IO Module qui oblige l'AMM à les rebooter ?

Ton contrat GTMS IBM qui pousse les mecs à venir mettre à jour les firmwares et rebooter sans même te prévenir ? :shock:  :doh: :D (Si si, déjà vu en vrai)

- Oui l'onduleur n'est pas pleinement opérationnelle mais j'aurais vu les arrets d'alimentation sur les log du bladecenter

- Un plantage de l'IO module, oui, il semblerait

- oO WTF ?? euuh j'espere qu'il va pas me faire ça...

 

 

 

@shuguet

 

 

C'est bien le truc tout en 1 avec disques + lames dans le même châssis ?

Oui c'est bien ça. Même si dans mon cas les disques sont sur un SAN DS3512 brancher en SAS.

 

 

BladeCenter E, H, HT si tu veux, mais S :'(

euuh j'en ai 2 des comme ça :'(  Le technicien IBM sera bientot dans nos locaux, je lui dirais de jeter un oeil

 

 

En tous cas, moi qui croyait que cela pouvait venir des ESXi, il semblerait que vous n'allez pas du tout dans cette direction.

Je préfère que ce soit matériel que logiciel, comme ça je vais profiter du technicien IBM dans mes locaux.


Modifié par Saratorn, 30/01/2014, 18:31.

  • 0

#13 pedro99

pedro99

    Membre actif

  • Membres
  • PipPipPipPip
  • 1 487 messages

Posté 30/01/2014, 21:21

Les seuls vrais gros problèmes que j'ai pu avoir avec VSphere ont toujours eu une cause hardware....
  • 0

#14 tdesmarest

tdesmarest

    Membre

  • Membres
  • PipPip
  • 26 messages
  • LocationParis

Posté 30/01/2014, 22:01

@tdesmarest

 

- Oui l'onduleur n'est pas pleinement opérationnelle mais j'aurais vu les arrets d'alimentation sur les log du bladecenter

 

En fait quand je parlais de système d'économie d'énergie je pensais plus à des technos du style green ethernet ou eee qui désactivent les ports "soit-disant" non utilisés sur un switch par exemple (ne me parlez plus des PowerConnect 5524 Grrrrrrr !!).


  • 0

#15 woueb

woueb

    Membre confirmé

  • Membres
  • PipPipPip
  • 567 messages
  • LocationMetz / Luxembourg

Posté 3/02/2014, 11:08

BladeCenter S...

Si oui, ne cherche pas plus loin, je n'ai eu que des emmerdes avec.

Chez un client, on à mis en standby un projet pendant 1 ans à cause de ces châssis.

Le taux de pannes du châssis/lames/switch était du jamais vu.

 

Alors tu as vraiment pas eu de bol, j'en ai mis une 10aine en prod avant de changer de boulot il y a 2 ans et j'ai jamais de soucis... :/

 

 

Oui c'est bien ça. Même si dans mon cas les disques sont sur un SAN DS3512 brancher en SAS.

 

C'est supporté ça maintenant ?

La dernière fois que j'ai regardé, ça ne l'était pas et ce n'était pas dans la roadmap.

 

Comme te l'ont conseillé d'autres personnes, ouvre un ticket chez IBM, si qq'un a déjà eu un bug similaire ils sauront t'aider.

 

Autrement, mis à part le bug de l'AMM dont je parlais (mais pas possible à confirmer vu que tu n'as pas retrouver la version) et ou un autre bug IBM, je dirais tu as éventuellement une bizarrerie dans ton implémentation réseau ?


  • 0

#16 Saratorn

Saratorn

    Membre

  • Membres
  • PipPip
  • 25 messages

Posté 4/02/2014, 14:56

Le technicien IBM m'a re-configuré les switchs du BladecenterS.

 

Wait and see ...


  • 0

#17 sigmaOS

sigmaOS

    Membre confirmé

  • Membres
  • PipPipPip
  • 666 messages
  • LocationREIMS

Posté 5/02/2014, 08:13

Pour le moment, peu de questions à se poser : 

 

1. Mettre à jour TOUTE l'infra.

2. Re-checker la config du Blade

 

Sig'


  • 0





Aussi étiqueté avec au moins un de ces mots-clés : deconnexion, hôtes, esxi

0 utilisateur(s) li(sen)t ce sujet

0 membre(s), 0 invité(s), 0 utilisateur(s) anonyme(s)