📄 中文摘要
随着对包容性语音技术需求的增加,多语言数据集在自然语言处理(NLP)研究中的重要性愈发凸显。然而,低资源语言中现有任务特定资源的有限认知阻碍了相关研究的进展。这一挑战在语言多样性较高的国家,如印度,尤为明显。通过对现有印度语音数据集进行跨任务分析,可以缓解数据稀缺的问题。这种分析关注数据集在多个下游任务中的效用,而非仅限于单一任务。以往的调查通常只列举单一任务的数据集,全面的跨任务分析仍然是一个未被充分探索的领域。因此,提出了Task-Lens,一个跨任务调查框架,旨在填补这一空白。