Post

데이터 쓰레기

현재 우리는 클라우드와 블록체인 기술을 많이 사용하고 있고, 이러한 기술들은 원본 데이터의 용량 이상의 데이터를 담고 있다. 이러한 데이터의 축적은 시간이 갈수록 증가하는 추세이며, 하드웨어의 발전 속도를 넘어서고 있다.

하드웨어 기술 발전에는 물리적 한계가 존재한다. 따라서 하드웨어의 효율이 무작정 좋아질 수만은 없을 것이다.

구글은 엄청난 규모의 클라우드 서버 센터를 가지고 있다. 하지만 현재 존재하는 그 센터마저도 부족해 센터를 더 지어야 하는 상황이다.

만약 계속 쌓여만 가는 데이터를 함부로 지울 수 없는 상황이 오고, 그 데이터가 유효한 데이터가 아님에도 쓰레기로 두어야 하는 상황이 온다면, 그로 인해 필요한 하드웨어의 숫자는 늘어날 것이고, 그러한 하드웨어의 수명이 다할 때에는 물리적인 쓰레기 또한 늘어나게 될 것이다.

지금의 플라스틱은 바다를 덮을 정도로 많은 양의 쓰레기로 인해 환경문제가 심각한 수준이다. 플라스틱의 역사는 100년도 되지 않았고, 플라스틱은 실질적으로 매우 유용하게 쓰일 수 있다. 하지만 현재는 그러한 유용성에도 불구하고 생산과 사용을 줄이자는 운동을 하고 있다.

이와 마찬가지로 데이터 쓰레기 또한 플라스틱과 같은 절차를 밟을 가능성이 충분히 있을 것이다. 이러한 문제에 관심을 가진 공학도들은 많지 않지만, 이 문제에 대해 생각할 필요는 충분히 있다고 본다. 이것은 결코 우리와 멀리 떨어져 있는 문제가 아니라 앞으로 우리가 직면할 가능성이 충분한 문제라고 생각한다.

또 다른 예로, 우리는 ‘물을 펑펑 쓴다’라는 표현을 사용하는데, 이는 마치 물이 무한한 자원이라고 생각하기에 나온 표현이다. 그러나 물 부족 문제는 이미 우리에게 닥쳐온 문제이다. 전기 또한 원자력 발전 이후 우리는 아무 생각 없이 많은 전기를 사용하고 있다. 마치 전기가 끊이지 않을 것처럼 말이다. 현재 전기를 더 효율적으로 생산하는 방법 등에 대한 연구는 진행 중이다. 왜냐하면 전기는 우리가 착각하거나 생각하지 못했던 것처럼 무한한 자원이 아니기 때문이다.

앞으로 데이터 쓰레기에 대한 문제는 반드시 고민해봐야 할 문제이고, 반드시 닥쳐올 문제일 것이다.

This post is licensed under CC BY 4.0 by the author.