I moduli ottici digitali funzionano nei sistemi moderni

Dec 17, 2025|

 

 

ILricetrasmettitore otticosi trova in una di quelle strane intersezioni nel networking in cui la fisica elegante incontra il pragmatismo brutale. All'interno di ogni modulo-che si tratti di un SFP da 30 dollari estratto da un contenitore in eccedenza o di un'unità ZR+ coerente da 12.000 dollari destinata alla metropolitana DCI- avviene la stessa conversione fondamentale: i fotoni diventano elettroni, gli elettroni diventano fotoni. I dettagli di implementazione variano notevolmente. Le modalità di fallimento variano ancora più selvaggiamente. E in qualche modo, nonostante decenni di sforzi di standardizzazione, far sì che due moduli di fornitori diversi funzionino bene insieme rimane un'avventura.

b41ff83b-2e3b-4a0a-b39c-0e65b915abb0

 

Cosa c'è realmente dentro la cosa

 

Apri un ricetrasmettitore (in realtà non farlo; la sola esposizione al laser lo rende una cattiva idea) e troverai una disposizione sorprendentemente densa di componenti che non sono sostanzialmente cambiati nell'architettura dalla fine degli anni '90. La sezione del trasmettitore ospita la sorgente luminosa-tipicamente un VCSEL per applicazioni multimodali a breve- raggio d'azione, un laser DFB per qualsiasi cosa seria su fibra mono-modale. Il lato ricevitore contiene un fotodiodo e un amplificatore a transimpedenza. Tra di loro si trova qualunque segnale che condizioni la velocità dei dati richiesta.

Il VCSEL merita una menzione speciale perché è allo stesso tempo l'eroe e il cattivo dell'ottica dei data center. I laser a emissione superficiale-a cavità verticale-hanno risolto il problema di produzione che affliggeva i dispositivi a emissione-edge: puoi testarli su-wafer prima di tagliarli, il che significa che sai effettivamente cosa stai spedendo. Sono economici. Sono abbastanza affidabili. Funzionano alla grande.

Ma i VCSEL hanno limitazioni di distanza che contano.

La luce da 850 nm attraverso la fibra multimodale colpisce le pareti di dispersione modale che nessuna quantità di DSP intelligente può superare completamente. Ottieni forse 100 metri a 25G prima che il diagramma a occhio inizi a sembrare arte moderna. La fibra OM4 nel pavimento sopraelevato non è stata progettata per ciò che le chiediamo di fare e l'adozione di OM5 rimane a metà tra "promettente" e "teorica" ​​nella maggior parte delle implementazioni aziendali che ho visto.

 

La domanda sulla lunghezza d'onda che nessuno pone correttamente

2
 

Le persone nuove al networking ottico tendono a fissarsi sui fattori di forma-QSFP contro SFP, DD contro OSFP-mentre sorvolano sulla selezione della lunghezza d'onda come se 850 nm e 1310 nm fossero opzioni intercambiabili che differiscono solo nel prezzo. Non lo sono.

850nm appartiene al mondo multimodale. L'attenuazione della fibra a questa lunghezza d'onda è di circa 2,5 dB/km, il che suona terribile finché non si ricorda che le corse multimodali si misurano in decine di metri, non in chilometri. Il vantaggio economico funziona perché i VCSEL sono più economici da produrre rispetto agli emettitori edge- e la fibra stessa tollera un allineamento più approssimativo. È abbastanza buono per la connettività da rack-a-rack.

1310 nm riduce l'attenuazione a circa 0,4 dB/km in modalità singola-. Questa è la banda O-, dove la dispersione cromatica raggiunge un minimo conveniente e puoi inviare segnali per 10 km senza amplificazione. La maggior parte dei moduli LR vive qui.

1550 nm ti porta a circa 0,3 dB/km-la "finestra di perdita-zero" della banda C-adorata da tutti nelle telecomunicazioni. I sistemi DWDM stipano dozzine di canali in questa banda perché gli amplificatori in fibra drogata con erbio- funzionano magnificamente qui. Ma questi EDFA costano denaro e, per distanze inferiori a 40 km, la spesa extra raramente ha senso.

L'errore che vedo ripetutamente: qualcuno specifica moduli da 1550 nm per un collegamento di campus di 2 km perché "una perdita inferiore deve essere migliore". Non è meglio. È più costoso senza alcun vantaggio e ora hai una complessità di inventario di cui non avevi bisogno.

 

Integrità del segnale e problema del recupero dell'orologio

 

È qui che le cose si fanno davvero interessanti e anche che gli ingegneri junior iniziano a commettere errori costosi.

I dati seriali ad alta-velocità non viaggiano con un segnale di clock. Le informazioni sui tempi devono essere recuperate dal flusso di dati stesso-questo è ciò che fanno i circuiti Clock e Data Recovery. Un ciclo ad aggancio di fase-all'interno del modulo controlla le transizioni nel flusso di bit in entrata, genera un clock locale da tali transizioni e utilizza il clock recuperato per campionare i bit successivi nel punto ottimale dell'occhio.

Funziona straordinariamente bene finché non funziona più.

I blocchi CDR richiedono transizioni sufficienti nei dati. La codifica 64B/66B utilizzata in Ethernet 10G garantisce margini sufficienti per soddisfare il PLL. Ma se qualcuno invia uno schema patologico-o peggio, una lunga serie di simboli identici da un dispositivo upstream che si comporta in modo anomalo-il CDR può perdere il blocco. Quando perde il blocco, si attiva l'allarme LOL (perdita del blocco), il collegamento si interrompe e stai fissando i contatori di errori chiedendoti cosa è andato storto.

La parte frustrante: il comportamento del CDR varia tra i fornitori. Ho visto moduli del produttore A mantenere il blocco attraverso sequenze di pattern che uccidevano immediatamente i moduli del produttore B. Entrambi soddisfacevano le specifiche. Entrambi hanno superato i test di conformità. Uno ha funzionato nell'ambiente di traffico reale del cliente, l'altro no.

 

DDM ha modificato per sempre la risoluzione dei problemi (quando funziona)

 

Prima che il monitoraggio diagnostico digitale diventasse standard, risolvere i problemi di un collegamento in fibra significava estrarre moduli, scambiare cavi e pregare qualunque divinità governasse il processo di controllo delle modifiche. Se il collegamento era interrotto, sapevi che qualcosa non andava. Non avevi idea di cosa.

DDM-a volte chiamato DOM, perché il settore ama gli acronimi ridondanti-ha cambiato la situazione. Ogni ricetrasmettitore moderno riporta la telemetria in tempo reale- tramite un'interfaccia I²C: temperatura, tensione di alimentazione, corrente di polarizzazione del laser, potenza TX, potenza RX. La specifica SFF-8472 definisce la mappa di memoria. Il tuo switch lo legge automaticamente.

Sembra un puro vantaggio, e soprattutto lo è. Ma sono stato scottato abbastanza volte dai dati DDM da aver sviluppato un sano scetticismo.

La lettura della potenza TX? È derivato da un fotodiodo di monitoraggio che campiona una frazione dell'emissione laser. L'efficienza di accoppiamento tra laser e MPD varia con la temperatura. I dati di calibrazione masterizzati nella EEPROM del modulo sono stati misurati a 25 gradi su una panchina da qualche parte a Shenzhen. Il tuo ambiente operativo effettivo è di 47 gradi perché il modulo si trova tra altri due ricetrasmettitori caldi in uno switch a pieno-carico.

Il numero sullo schermo è approssimativo. Di solito è una buona approssimazione. Ma ho imparato a non dichiarare la vittoria basandosi esclusivamente sulle letture del DDM che sembrano normali. Prendi il misuratore di potenza ottica. Misura la luce effettiva che colpisce la fibra.

 

3

 

La temperatura è tutto

 

Non posso sopravvalutare quanto la temperatura domini il comportamento del modulo ottico. Ogni parametro che conta cambia con la temperatura.

La corrente di soglia del laser aumenta man mano che i moduli si riscaldano-il dispositivo necessita di più corrente di pilotaggio per ottenere la stessa uscita ottica. L'efficienza della pendenza diminuisce, il che significa che ogni milliampere aggiuntivo di polarizzazione produce meno luce. Derive della lunghezza d'onda, che contano enormemente nei sistemi CWDM e DWDM in cui la spaziatura tra i canali è ridotta. La reattività del fotodiodo cambia. Anche le tensioni di riferimento all'interno dei circuiti di monitoraggio variano.

I produttori specificano gli intervalli operativi-tipicamente da 0 gradi a 70 gradi per il livello commerciale, da -40 gradi a 85 gradi per quello industriale. Ciò che non trasmettono adeguatamente è quanto le prestazioni del modulo siano peggiori ai margini di quell'intervallo rispetto al centro.

Ho misurato moduli sul campo che erano 15 gradi più caldi di quanto indicato dal rapporto sulla temperatura ambiente dello switch. Il sensore di temperatura della custodia sul ricetrasmettitore indica 63 gradi mentre il telaio dell'interruttore riporta "flusso d'aria normale" e "temperatura 38 gradi" nel monitoraggio ambientale. La discrepanza esisteva perché l'interruttore misurava la temperatura dell'aria in ingresso, mentre il ricetrasmettitore cuoceva nell'ombra termica di un QSFP-DD adiacente che funzionava con un'ottica coerente a 14 watt.

Nessuno ha ricevuto avvisi. Il collegamento funzionava ancora-a malapena-con errori pre-FEC elevati che occasionalmente si trasformavano in perdite di frame. Ci sono voluti tre mesi per capire perché quel collegamento specifico avesse tassi di ritrasmissione più elevati rispetto a collegamenti identici altrove nel tessuto.

 

La questione-delle terze parti

 

Tutti vogliono avere informazioni sui ricetrasmettitori-di terze parti. La differenza di prezzo è difficile da ignorare: da 3 a 5 volte più economica rispetto ai moduli OEM con specifiche apparentemente identiche.

Il contratto multi-fonte esiste specificatamente per consentire l'interoperabilità. Un SFP-10G-LR conforme dell'azienda X dovrebbe essere funzionalmente equivalente a uno dell'azienda Y. I parametri ottici sono definiti. Le dimensioni meccaniche sono standardizzate. L'interfaccia elettrica segue le specifiche pubblicate dai consorzi di settore.

La realtà, come al solito, diverge dalle specifiche.

I fornitori di switch codificano le EEPROM del ricetrasmettitore con stringhe ID del fornitore. Cisco controlla queste stringhe e disabilita per errore-le porte che non corrispondono all'elenco approvato. Le piattaforme più recenti di Juniper registrano gli avvisi e rifiutano le chiamate di supporto. HPE è andata avanti e indietro nell'applicazione delle norme a seconda della linea di prodotto e della versione del firmware.

Le soluzioni alternative esistono. Il comando service unsupported-transceiver di Cisco ha consentito di risparmiare innumerevoli pianificazioni di implementazione. I fornitori di terze-parti programmano le proprie EEPROM per segnalare codici fornitore compatibili. Dispositivi come FS Box ti consentono di riprogrammare i moduli sul campo.

Ma ecco quello che nessuno ti dice: quando le cose vanno male-e alla fine lo faranno-il supporto diventa avversario. Chiama il TAC con un problema di collegamento, menziona l'ottica di terze-parti e guarda la fine della conversazione. "Sostituire con ricetrasmettitori supportati e richiamare se il problema persiste." Non hanno torto dal punto di vista del supporto. Inoltre, non sono utili alle 2 del mattino quando il tessuto è degradato.

La mia regola personale, sviluppata attraverso una dura esperienza: terze parti-in laboratorio, OEM nei percorsi di produzione che contano. Il risparmio sui costi sembra meno convincente quando sei tu a risolvere gli errori CRC intermittenti che potrebbero essere il ricetrasmettitore, la fibra, il firmware e non puoi escludere nulla.

 

 

La contaminazione ti troverà

 

La causa principale dei problemi del collegamento ottico non ha nulla a che fare con il modulo stesso. È sporco.

Un granello di polvere sulla terminazione della fibra può attenuare il segnale abbastanza da spingere un collegamento oltre la soglia di errore. A 100G e oltre, il margine non è più quello di una volta. Stai operando più vicino ai limiti di sensibilità del ricevitore. Quel granello di polvere che sarebbe stato invisibile su Ethernet 1G ora causa la perdita di pacchetti su 400G.

Il nucleo di una fibra monomodale- ha un diametro di 9 micrometri. Un capello umano è lungo circa 70 micrometri. Le particelle contaminanti più piccole di qualsiasi cosa visibile senza ingrandimento possono bloccare completamente il percorso ottico.

Ispezionare prima di connettersi. Sempre. Utilizzare un fibroscopio, non un controllo visivo. Non mi interessa se il cavo di connessione è uscito da una busta sigillata cinque secondi fa-la busta non è pulita, le tue dita hanno toccato qualcosa, l'aria nel tuo data center contiene particelle. Ispezionare, pulire se necessario, ispezionare nuovamente, quindi collegare.

La pulizia stessa introduce rischi. La pulizia a secco crea una carica statica che attira più contaminanti. La pulizia a umido con alcool isopropilico può lasciare residui se lasci evaporare invece di asciugarla immediatamente. I detergenti con un-clic funzionano bene finché non sono esauriti e qualcuno continua comunque a fare clic, ridistribuendo i contaminanti attraverso la ghiera.

Ho osservato un tecnico dedicare quattro ore alla risoluzione dei problemi di un collegamento intermittente. Moduli sostituiti due volte. Controllo del percorso dei cavi. Configurazione rivista. Alla fine ho tirato fuori il telescopio e ho trovato quelli che sembravano residui di impronte digitali sull'adattatore della paratia. Pulito correttamente. Link si rialzò pulito e rimase sveglio.

Quattro ore. Per un'impronta digitale.

 

Ciò che conta davvero quando si selezionano i moduli

 

Dopo tutti i dettagli tecnici, il processo di selezione si riduce solitamente ad alcune considerazioni pratiche che non compaiono in nessuna scheda tecnica.

Qual è la tua piattaforma di cambio? Se sei un negozio Cisco, la domanda sul fattore di forma ha ampiamente risposto. Se utilizzi Arista o Juniper sulle foglie e qualcos'altro sulla colonna vertebrale, potresti avere delle opzioni-ma l'esercizio di tali opzioni crea complessità nell'inventario. La coerenza ha valore.

Quale distanza devi effettivamente coprire? Misura i percorsi dei cavi. Aggiungi margine per pannelli di permutazione e giunzioni. Quindi scegli il tipo di modulo più economico che soddisfa i requisiti di distanza con spazio libero. Specificare i moduli LR per corse di 50 metri perché "potremmo aver bisogno della portata più tardi" è uno spreco di denaro.

Qual è la tua fibra vegetale? Multimodalità all'interno degli edifici, mono-modalità tra edifici-questo è ancora il modello comune. Combattere questo modello costa di più che lavorarci sopra.

Quanto ti fidi della qualità della tua installazione? 400G ha un margine inferiore a 100G. I connettori sporchi che funzionavano bene a velocità inferiori causeranno problemi. Se il tuo cablaggio strutturato risale a quando Cat5e era considerato a prova di futuro-, aspettati problemi.

Il consiglio noioso di solito è giusto: adatta la tecnologia ai requisiti effettivi, acquista da fornitori che ti supporteranno quando le cose si rompono, pulisci ogni connettore ogni volta che lo tocchi. I moduli stessi sono diventati straordinariamente affidabili. I problemi sono quasi sempre altrove.

 

Invia la tua richiesta