DeepSeek-R1 che combina AI e Edge Computing per IoT industriale

Introduzione

I modelli distillati di piccole dimensioni di DeepSeek-R1 vengono messi a punto usando i dati della catena di pensiero generati da DeepSeek-R1, contrassegnati con...tag, ereditando le capacità di ragionamento di R1. Questi set di dati perfezionati includono esplicitamente processi di ragionamento come la decomposizione dei problemi e le detrazioni intermedie. L'apprendimento di rinforzo ha allineato i modelli di comportamento del modello distillato con le fasi di ragionamento generate da R1. Questo meccanismo di distillazione consente ai piccoli modelli di mantenere l'efficienza computazionale, ottenendo capacità di ragionamento complesse vicino a quelle di modelli più grandi, che ha un valore significativo dell'applicazione negli scenari limitati dalle risorse. Ad esempio, la versione 14B raggiunge il 92% del completamento del codice del modello originale DeepSeek-R1. Questo articolo introduce il modello distillato DeepSeek-R1 e le sue applicazioni principali nel bordo industriale, riassunto nelle seguenti quattro direzioni, insieme a casi di implementazione specifici:

DC3C637C5BEAD8B62ED51B6D83AC0B4

Manutenzione predittiva delle attrezzature

Implementazione tecnica

Sensore Fusion:

Integrare le vibrazioni, la temperatura e i dati di corrente dai PLC tramite il protocollo Modbus (velocità di campionamento 1 kHz).

Estrazione delle caratteristiche:

Esegui l'impulso del bordo su Jetson Orin NX per estrarre le funzionalità di serie temporali 128-dimensionali.

Inferenza del modello:

Distribuire il modello DeepSeek-R1-Distill-14b, inserendo i vettori di funzionalità per generare valori di probabilità di guasto.

Regolazione dinamica:

Innescare ordini di lavoro di manutenzione quando fiducia> 85%e avviare un processo di verifica secondaria quando <60%.

Caso rilevante

Schneider Electric ha implementato questa soluzione sui macchinari minerari, riducendo i tassi di falsi positivi del 63% e i costi di manutenzione del 41%.

1

Esecuzione del modello distillato di DeepSeek R1 su computer INSETTHEGNE

Ispezione visiva migliorata

Architettura di output

Pipeline di distribuzione tipica:

fotocamera = gige_vision_camera (500fps) # gigabit industrial fotocamera
frame = fotocamera.capture () # Immagine di acquisizione
preprocessed = opencv.denOise (frame) # denoising preprocessing
Defect_Type = deepseek_r1_7b.infer (preprocesso) # Classificazione dei difetti
Se Defect_Type! = 'Normal':
Plc.trigger_reject () # meccanismo di smistamento

Metriche di performance

Ritardo di elaborazione:

82 ms (Jetson Agx Orin)

Precisione:

Il rilevamento del difetto modellato iniezione raggiunge il 98,7%.

2

Le implicazioni di DeepSeek R1: vincitori e perdenti nella catena del valore dell'intelligenza artificiale generativo

Ottimizzazione del flusso di processo

Tecnologie chiave

Interazione del linguaggio naturale:

Gli operatori descrivono le anomalie dell'attrezzatura tramite voce (ad es. "Fluttuazione della pressione dell'estrusore ± 0,3 MPa").

Ragionamento multimodale:

Il modello genera suggerimenti di ottimizzazione basati su dati storici dell'attrezzatura (ad es. Regolazione della velocità della vite del 2,5%).

Verifica gemella digitale:

Convalida della simulazione dei parametri sulla piattaforma di fonderia Edgex.

Effetto di implementazione

L'impianto chimico di BASF ha adottato questo schema, ottenendo una riduzione del 17% del consumo di energia e un aumento del 9% del tasso di qualità del prodotto.

3

Edge AI e Future of Business: Openai O1 vs. DeepSeek R1 per assistenza sanitaria, automobilistica e iiot

Recupero istantaneo della base di conoscenza

Design dell'architettura

Database vettoriale locale:

Utilizzare Chromadb per archiviare i manuali delle apparecchiature e le specifiche di processo (incorporamento della dimensione 768).

Recupero ibrido:

Combina l'algoritmo BM25 + somiglianza del coseno per la query.

Generazione dei risultati:

Il modello R1-7B riassume e perfeziona i risultati del recupero.

Caso tipico

Gli ingegneri di Siemens hanno risolto i guasti dell'inverter attraverso query in linguaggio naturale, riducendo il tempo medio di elaborazione del 58%.

Sfide e soluzioni di distribuzione

Limitazioni di memoria:

Utilizzato la tecnologia di quantizzazione della cache KV, riducendo l'utilizzo della memoria del modello 14B da 32 GB a 9 GB.

Garantire prestazioni in tempo reale:

Latenza a inferenza singola stabilizzata a ± 15 ms attraverso l'ottimizzazione del grafico CUDA.

Drift del modello:

Aggiornamenti incrementali settimanali (trasmissione solo il 2% dei parametri).

Ambienti estremi:

Progettato per ampie intervalli di temperatura da -40 ° C a 85 ° C con livello di protezione IP67.

5
微信图片 _20240614024031.jpg1

Conclusione

I costi di distribuzione attuali sono ora diminuiti a $ 599/nodo (Jetson Orin NX), con applicazioni scalabili che si formano in settori come la produzione 3C, l'assemblaggio automobilistico e la chimica dell'energia. L'ottimizzazione continua dell'architettura MOE e della tecnologia di quantizzazione dovrebbe consentire al modello 70B di funzionare su dispositivi Edge entro la fine del 2025.

Trova la soluzione del cavo ELV

Cavi di controllo

Per BMS, autobus, industriale, cavo di strumentazione.

Sistema di cablaggio strutturato

Rete e dati, cavo in fibra ottica, cavo patch, moduli, facciata

2024 Revisione delle mostre ed eventi

16 aprile-18, 2024 Middle-East-Energy a Dubai

16 aprile-18, 2024 Securika a Mosca

Evento di lancio di nuovi prodotti e tecnologie di maggio.

22 ottobre-25 °, 2024 Cina di sicurezza a Pechino

19 novembre-20, 2024 Connected World KSA


Tempo post: feb-07-2025