Как конвертировать несколько файлов DICOM в единый JSON Array
Этот урок показывает, как конвертировать несколько файлов DICOM в одну JSON-аррию с помощью C#. Этот подход идеально подходит для инженеров данных, которые нуждаются в экспорте метаданных DIKOM для аналитических инструментов, баз данных или трубопроводов данных.
Преимущества JSON Array Export
- Обработка персональных данных* :- Импортировать несколько записей DICOM в базы данных в одну операцию.
«Аналитики готовы»- Изображения JSON можно загрузить непосредственно в Python, Spark или хранилища данных.
• компактный выход*:- Один файл, содержащий все метаданные, упрощает управление данными.
Преимущества: Подготовка к окружающей среде
- Настройка Visual Studio или любой совместимый .NET IDE.
- Создайте новый проект приложения .NET 8 для консоли.
- Инсталляция Aspose.Medical из NuGet Package Manager.
- Подготовить папку, содержащую несколько файлов DICOM.
Step-by-Step Guide to Convert Multiple DICOM Files to JSON Array
Шаг 1: Инсталляция Aspose.Medical
Добавьте в свой проект библиотеку Aspose.Medical с помощью NuGet.
Install-Package Aspose.MedicalШаг 2: Включение необходимых номенклатур
Добавьте ссылки на требуемые именные пространства в вашем коде.
using Aspose.Medical.Dicom;
using Aspose.Medical.Dicom.Serialization;Шаг 3: Загрузите мультифайлы DICOM
Загрузите файлы DICOM из папки в коллекцию.
string inputFolder = @"C:\DicomStudies";
string[] dicomPaths = Directory.GetFiles(inputFolder, "*.dcm");
List<DicomFile> dicomFiles = new();
foreach (string path in dicomPaths)
{
dicomFiles.Add(DicomFile.Open(path));
}Шаг 4: Экстракт Dataset Array
Создайте ряд объектов Dataset из загруженных файлов.
Dataset[] datasets = dicomFiles
.Select(dcm => dcm.Dataset)
.ToArray();Шаг 5: Сериализируйтесь на JSON Array
Использование DicomJsonSerializer.Serialize С помощью Dataset Array.
string jsonArray = DicomJsonSerializer.Serialize(datasets, writeIndented: true);Шаг 6: Сохраните JSON Array
Сохраните JSON array в файл.
File.WriteAllText("dicom_studies.json", jsonArray);
Console.WriteLine($"Exported {datasets.Length} DICOM datasets to JSON array.");Полный пример кода
Вот полный пример, демонстрирующий, как конвертировать несколько файлов DICOM в JSON диапазон:
using Aspose.Medical.Dicom;
using Aspose.Medical.Dicom.Serialization;
string inputFolder = @"C:\DicomStudies";
string outputFile = "dicom_studies.json";
// Get all DICOM files
string[] dicomPaths = Directory.GetFiles(inputFolder, "*.dcm");
Console.WriteLine($"Found {dicomPaths.Length} DICOM files.");
// Load all files
List<DicomFile> dicomFiles = new();
foreach (string path in dicomPaths)
{
try
{
dicomFiles.Add(DicomFile.Open(path));
}
catch (Exception ex)
{
Console.WriteLine($"Skipping invalid file: {Path.GetFileName(path)}");
}
}
// Build dataset array
Dataset[] datasets = dicomFiles
.Select(dcm => dcm.Dataset)
.ToArray();
// Serialize to JSON array
string jsonArray = DicomJsonSerializer.Serialize(datasets, writeIndented: true);
// Save to file
File.WriteAllText(outputFile, jsonArray);
Console.WriteLine($"Successfully exported {datasets.Length} datasets to {outputFile}");Пример JSON Array Output
Выходный JSON array выглядит так:
[
{
"00080005": { "vr": "CS", "Value": ["ISO_IR 100"] },
"00100010": { "vr": "PN", "Value": [{ "Alphabetic": "DOE^JOHN" }] },
"00100020": { "vr": "LO", "Value": ["12345"] }
},
{
"00080005": { "vr": "CS", "Value": ["ISO_IR 100"] },
"00100010": { "vr": "PN", "Value": [{ "Alphabetic": "SMITH^JANE" }] },
"00100020": { "vr": "LO", "Value": ["67890"] }
}
]Обработка больших данных с помощью LINQ
Для лучшего управления памятью с большими наборами данных используйте проекции LINQ:
using Aspose.Medical.Dicom;
using Aspose.Medical.Dicom.Serialization;
string inputFolder = @"C:\LargeDicomArchive";
string outputFile = "large_export.json";
// Process files lazily to manage memory
Dataset[] datasets = Directory.GetFiles(inputFolder, "*.dcm")
.Select(path =>
{
try
{
return DicomFile.Open(path).Dataset;
}
catch
{
return null;
}
})
.Where(ds => ds != null)
.ToArray()!;
string jsonArray = DicomJsonSerializer.Serialize(datasets, writeIndented: true);
File.WriteAllText(outputFile, jsonArray);
Console.WriteLine($"Exported {datasets.Length} datasets.");Добавить доклад о прогрессе
Для крупных матчей добавьте отчет о прогрессе:
using Aspose.Medical.Dicom;
using Aspose.Medical.Dicom.Serialization;
string inputFolder = @"C:\DicomStudies";
string[] dicomPaths = Directory.GetFiles(inputFolder, "*.dcm");
List<Dataset> datasets = new();
int processed = 0;
int total = dicomPaths.Length;
foreach (string path in dicomPaths)
{
try
{
DicomFile dcm = DicomFile.Open(path);
datasets.Add(dcm.Dataset);
}
catch (Exception ex)
{
Console.WriteLine($"Error: {Path.GetFileName(path)} - {ex.Message}");
}
processed++;
if (processed % 100 == 0 || processed == total)
{
Console.WriteLine($"Progress: {processed}/{total} ({processed * 100 / total}%)");
}
}
string jsonArray = DicomJsonSerializer.Serialize(datasets.ToArray(), writeIndented: true);
File.WriteAllText("export.json", jsonArray);
Console.WriteLine($"Export complete: {datasets.Count} datasets.");Импорт JSON Array в аналитические инструменты
Python Пример
import json
import pandas as pd
# Load the exported JSON array
with open('dicom_studies.json', 'r') as f:
dicom_data = json.load(f)
# Convert to DataFrame for analysis
df = pd.json_normalize(dicom_data)
print(df.head())Скачать в MongoDB
// Using mongoimport
// mongoimport --db medical --collection studies --jsonArray --file dicom_studies.json
Вспоминания о памяти
При работе с очень большими наборами данных:
- Процесс в батах: разделить файлы на баты 100-500 файлов.
- Stream Output: Используйте сериализацию, основанную на потоке, для очень больших ралей.
- Показать файлы: Убедитесь, что объекты DicomFile удаляются после извлечения наборов данных.
// Batch processing example
int batchSize = 100;
string[] allFiles = Directory.GetFiles(inputFolder, "*.dcm");
int batchNumber = 0;
for (int i = 0; i < allFiles.Length; i += batchSize)
{
string[] batch = allFiles.Skip(i).Take(batchSize).ToArray();
Dataset[] datasets = batch
.Select(path => DicomFile.Open(path).Dataset)
.ToArray();
string batchJson = DicomJsonSerializer.Serialize(datasets, writeIndented: true);
File.WriteAllText($"batch_{batchNumber++}.json", batchJson);
}Дополнительная информация
- JSON Array формат идеально подходит для массового импорта в NoSQL базы данных.
- Рассмотрим компрессирование больших файлов JSON для эффективности хранения.
- Для стриминговых сценариев, рассмотрите использование формата NDJSON (newline-delimited JSON) вместо этого.
Заключение
Этот урок показал вам, как конвертировать несколько файлов DICOM в единый JSON диапазон в C# с использованием Aspose.Medical. Этот подход позволяет эффективно экспортироваться массы данных для анализа, импорта баз данных и интеграции трубопроводов данных.