Các nhà nghiên cứu tại Viện Salk đã tạo ra một bước đột phá trong lĩnh vực di truyền học bằng cách phát triển công cụ ShortStop, sử dụng công nghệ học máy để khám phá các vùng DNA thường bị bỏ qua trong quá trình tìm kiếm các microprotein có thể đóng vai trò quan trọng trong bệnh tật. Công cụ này giúp các nhà khoa học xác định các vùng DNA có tiềm năng mã hóa microprotein và dự đoán khả năng sinh học của chúng, từ đó tiết kiệm thời gian và chi phí trong việc nghiên cứu các microprotein liên quan đến sức khỏe và bệnh tật.

ShortStop hoạt động dựa trên nguyên tắc phân loại microprotein thành hai loại: chức năng và không chức năng. Quá trình phân loại này được thực hiện dựa trên dữ liệu huấn luyện từ các bộ dữ liệu ngẫu nhiên được tạo ra bởi máy tính. Bằng cách so sánh các microprotein tìm thấy với các mẫu giả, ShortStop có thể nhanh chóng quyết định liệu một microprotein mới có khả năng chức năng hay không. Việc này giúp các nhà nghiên cứu tập trung vào những microprotein có tiềm năng cao, từ đó tăng hiệu quả của quá trình nghiên cứu.
Khi áp dụng ShortStop vào một bộ dữ liệu đã được công bố trước đó, các nhà nghiên cứu đã đạt được kết quả đáng kể. Họ xác định được 8% microprotein có khả năng chức năng, ưu tiên chúng cho việc theo dõi tiếp theo. Công cụ này cũng giúp xác định các microprotein bị bỏ qua bởi các phương pháp khác, bao gồm cả một microprotein đã được xác nhận bằng cách phát hiện trong các tế bào và mô của con người. Điều này cho thấy ShortStop không chỉ giúp tăng hiệu quả mà còn mở rộng kiến thức về các microprotein có thể có vai trò quan trọng trong sinh học.
Ứng dụng gần đây nhất của ShortStop là trong việc phân tích dữ liệu di truyền từ các khối u phổi của con người và mô lân cận bình thường. Qua đó, các nhà nghiên cứu đã tạo ra danh sách các microprotein tiềm năng chức năng. Một số microprotein nổi bật mà ShortStop tìm thấy đã được biểu hiện nhiều hơn trong mô khối u hơn mô bình thường, cho thấy chúng có thể đóng vai trò là dấu ấn sinh học hoặc microprotein chức năng cho ung thư phổi. Phát hiện này không chỉ chứng minh giá trị của ShortStop và công nghệ học máy trong việc ưu tiên các ứng viên cho nghiên cứu và phát triển điều trị trong tương lai mà còn mở ra hy vọng mới trong việc tìm kiếm các công cụ chẩn đoán và điều trị hiệu quả hơn cho ung thư và các bệnh khác như Alzheimer.
Các nhà nghiên cứu hy vọng rằng với sự hỗ trợ của ShortStop, họ sẽ tìm ra các microprotein mới liên quan đến sức khỏe và bệnh tật. Việc này không chỉ giúp hiểu rõ hơn về cơ chế phân tử của các bệnh mà còn mở ra những con đường mới cho việc chẩn đoán và điều trị. Từ đó, những công cụ như ShortStop được kỳ vọng sẽ đóng vai trò quan trọng trong việc chuyển đổi y học từ việc chữa bệnh sang việc phòng bệnh, giúp cải thiện chất lượng cuộc sống cho con người.