EDXML (E là Event, D là Dataset và XML) được tạo ra vào năm 2009 bởi Dik Takken với nhiệm vụ tìm kiếm một biểu diễn dữ liệu có thể mở rộng, đúng với dữ liệu gốc, không phụ thuộc vào tên miền và không quá phức tạp.
Một biểu diễn dữ liệu chung nằm ở trung tâm của bất kỳ nỗ lực tích hợp dữ liệu nào. Nhiều tiêu chuẩn biểu diễn dữ liệu khác nhau tồn tại, nhưng những tiêu chuẩn này thường bị giới hạn trong các lĩnh vực cụ thể như pháp y, thương mại điện tử hoặc an ninh mạng. Tích hợp dữ liệu từ các tên miền khác nhau cho phép có hai cách tiếp cận.
Tùy chọn một là tạo một biểu diễn mới bằng cách kết hợp các khía cạnh từ tất cả các tên miền. Điều này mang lại một biểu diễn dữ liệu tùy chỉnh, phức tạp và dài dòng, yêu cầu phần mềm phân tích tùy chỉnh phức tạp để xử lý nó.
Tùy chọn hai liên quan đến việc tìm kiếm một 'điểm chung' cho tất cả các tên miền. Càng có nhiều tên miền tham gia, điểm chung này sẽ càng thu hẹp và độ 'trung thực' của dữ liệu càng bị ảnh hưởng.
EDXML cung cấp một biểu diễn dữ liệu tránh đánh đổi phạm vi/độ phức tạp/độ trung thực điển hình bằng cách kết hợp dữ liệu với ngữ nghĩa. Cấu trúc vật lý của dữ liệu được tách rời khỏi cấu trúc ngữ nghĩa của nó, dẫn đến một biểu diễn đơn giản có phạm vi hầu như không giới hạn trong khi vẫn giữ được độ trung thực của dữ liệu gốc càng nhiều càng tốt.