Ashwini Vaishnaw 정보 기술 장관은 AI Kosha 플랫폼을 발표하면서 14,000 GPU가 올해 초 발표 된 약 10,000 명에 비해 공유 액세스를 위해 의뢰되었다고 발표했다고 밝혔다. 파일 | 사진 크레디트 : Ani
2025 년 3 월 6 일, 노조 정부는 인공 지능 모델과 도구 개발을 돕는 비 개인적인 데이터의 홈으로 선전되고있는 데이터 세트가있는 플랫폼 인 AI Kosha를 출시했습니다. 출시시 플랫폼에는 316 개의 데이터 세트가 포함되어 있으며, 이들의 대부분은 인도 언어를위한 언어 번역 도구를 만들거나 검증하는 데 도움이되는 프로그램입니다.
Indiaai DataSets 플랫폼은 Union Government의 주요 국가 지원 AI 노력 인 Indiaai Mission의 7 가지 기둥 중 하나입니다. 미션의 지출은 ₹ 10,370 crore의 지출을 보유하고 있으며 지난 달 센터는 컴퓨팅 용량 기둥에서 스타트 업 및 학계가 AI 모델을 훈련하고 실행하는 데 필요한 그래픽 프로세싱 장치 (GPU)에 풀링 된 액세스를 사용할 수 있다고 발표했습니다.
번역 외에 제한된 데이터 세트에는 Health Data, 2011 인구 조사 데이터와 같은 Telangana의 오픈 데이터 이니셔티브 제출이 포함됩니다. 인도 위성에 의해 캡처 된 위성 이미지; 기상 및 오염 데이터 등.
더 많은 GPU
Ashwini Vaishnaw 정보 기술 장관은 AI Kosha 플랫폼을 발표하면서 14,000 GPU가 올해 초 발표 된 약 10,000 명에 비해 공유 액세스를 위해 의뢰되었다고 발표했다고 밝혔다. Vaishnaw는 더 많은 GPU가 분기별로 추가 될 것이라고 말했다.
장관은 또한 Openai 및 Google과 같은 미국 기업들이 지출 해야하는 비용의 일부로 그러한 모델을 훈련시키고 시작할 수있는 중국 회사 인 Deepseek의 성공에 따라 시급한 목표 인 자체 재배 기초 AI 모델을 만들기위한 정부 지원 노력에 대한 업데이트를 제공했습니다. Vaishnaw 씨는“이제이 팀은 이러한 응용 프로그램을 평가하는 방법이 실제로 침수되고 있습니다.

정부 데이터 세트
노조 정부가 다른 기관을 활용하기 위해 대중 데이터를 집계하려는 것은 이번이 처음이 아닙니다. 정부의 공개 거버넌스 데이터 플랫폼 (Data.gov.in)은 현재 인도 전역의 여러 정부 기관에서 제공하는 12,000 개가 넘는 데이터 세트를 주최합니다. 정부는 여러 부처와 부서의“최고 데이터 책임자”를 지정하여 연구원, 회사 및 정부의 다른 지역에서 사용할 수있는 데이터 세트를 제공하도록 장려했습니다.
2018 년에 정부는 강력한 회사가 신생 기업의 교통 데이터와 같은 비 개인 데이터에 대한 신생 기업 및 정부가 새로운 참가자를 돕고 정부 정책을 지원할 수있는 스타트 업 및 정부의 액세스를 제공 할 가능성을 탐구 할위원회를 구성했습니다. Infosys의 공동 창립자 인 Kris Gopalakrishnan이 이끄는위원회는 2020 년에 보고서를 제출했습니다. 그러나 개인 플레이어는 다른 당사자와 데이터를 공유하기를 꺼려했기 때문에 기술 산업의 푸시 백에 직면했습니다. 민간 기업의 비인격 데이터에 관한 정부의 대화는 Chatgpt와 같은 LLM (Lange Language Models)이 출현하기 전에 크게 일어났다.
게시 -2025 년 3 월 6 일 오후 10시 47 분 IS