Pular para Navegação

Prof.ª Dra. Maria Clara Paixão de Sousa

É Professora da Universidade de São Paulo, junto ao Departamento de Letras Clássicas e Vernáculas da Faculdade de Filosofia, Letras e Ciências Humanas, e líder do grupo de pesquisas Humanidades Digitais. É doutora em Linguística pela Universidade Estadual de Campinas (2004), com pós-doutorado na Universidade Estadual de Campinas (2004-2006) e na Universidade de São Paulo (2007). Seu interesse original de pesquisa, fundado em sua formação na área de Teoria Gramatical, foi o fenômeno da Mudança Linguística, levando a pesquisas nas áreas de Linguística Histórica, Filologia e Linguística Computacional, com ênfase na edição filológica digital e na anotação linguística automática. Fez parte das equipes fundadoras do Corpus Tycho Brahe, o primeiro corpus sintaticamente anotado do Português (1998-2007) e da Biblioteca Digital Brasilia, tem se dedicado centralmente ao campo das Humanidades Digitais: coordenou o I Seminário Internacional em Humanidades Digitais no Brasil (2013), foi uma das fundadoras da AHDig, Associação das Humanidades Digitais (2013), e foi eleita como membro do Comitê Executivo da Global Outlook Digital Humanities (GO::DH) (2014-2015). Atualmente, conduz o projeto "Histórias do Brasil: Trajetória editorial e mapeamento linguístico de relatos de viagens quinhentistas em um corpus anotado de informações ligadas"(http://historiasdobrasil.net), parte do qual realizado em forma de estágio de pesquisa na Universidade de York, no Reino Unido, com o sub-projeto "Sintaxe e estrutura informacional da 'História da província Sancta cruz', 1576" (2015-2016) .


Projetos de Pesquisa

1. Syntax and information structure in the first 16th century Portuguese narrative about Brazil

Descrição: This Project aims at investigating linguistic and philological aspects of three representative pieces of travel literature: Magalhães de Gandavo's "História da Província Santa Cruz" (1576), Fernão Cardim's "Tratados da terra e gente do Brasil" (1584) and Gabriel Soares de Sousa's "Notícias do Brasil" (1584) . From the linguistic perspective, we aim at studying the relationship between syntax and information structure in the texts - including the original versions, their subsequent editions from the 16th to the 19th centuries, and, in some cases, their English, French and Spanish translations. From the philological perspective, we aim at reconstructing the complex editorial history of each text, by systematizing their bibliographical fields and producing critical digital editions of reference versions. The most visible product of the Project will be a linked-data repository organized around this material, which will bind them in a logical unit with several levels of analysis, combining philological, syntactic and information structure annotations. This intensive annotation will serve two purposes: first, it will provide the basis for further grammatical work based on the texts; second, it will provide the material for the investigation of the thematic and structural similarity among those texts - a traditionally observed, but never systematically researched aspect..

2. Histórias do Brasil: Trajetória editorial e mapeamento linguístico de relatos de viagens quinhentistas em um corpus anotado de informações ligadas

Descrição: O projeto (cf. http://historiasdobrasil.net) estudará três obras fundamentais da literatura quinhentista sobre o Brasil ? a ?História da Província Santa Cruz? de Magalhães de Gandavo (1576), o ?Tratados da terra e gente do Brasil? de Fernão Cardim (1584) e ?Notícias do Brasil? de Gabriel Soares de Sousa (1584) ? sob as perspectivas linguística e filológica, buscando explorar o diálogo estrutural e temático tradicionalmente observado entre elas, mas nunca sistematicamente pesquisado. Da perspectiva filológica, recuperaremos a complexa trajetória editorial de cada uma das obras, sistematizando seus campos bibliográficos desde seu surgimento no século XVI até os dias atuais. Da perspectiva linguística, mapearemos computacionalmente a estrutura sintática e informacional de cada texto e de suas diferentes versões ao longo do tempo, estudando aspectos gramaticais relevantes dos textos e a maneira como estes interagem com a estrutura da informação, numa abordagem comparativa e diacrônica. O projeto produzirá, com isso, um portal de informações ligadas, formando em torno das obras uma rede lógica aprofundada em diversas camadas de análise, graças à aplicação conjunta de técnicas de anotação linguística e web-semântica. Há um duplo efeito na construção dessa rede: de um lado, os fragmentos dispersos de informação sobre as obras passarão a compor um conjunto coeso, com repercussões positivas em diferentes áreas de pesquisa (e, acreditamos, na área da educação). De outro lado, a rede constituirá, em si, uma nova camada a depositar-se sobre as representações editoriais historicamente acumuladas sobre esses textos. Consideramos fundamental refletir criticamente sobre os efeitos dessa representação computacional, e conduziremos paralelamente a prática e a problematização dessa construção. Assim, tanto ao situar-se na confluência entre as humanidades e a computação, como ao adotar uma postura crítica sobre os produtos dessa confluência, o projeto se insere no campo das Humanidades Digitais, e é conduzido no âmbito do Grupo de Pesquisas pioneiro nesse campo no país..

3. Vésperas Brasilianas: uma agenda para os estudos sintáticos do Português Brasileiro nos primeiros séculos

Descrição: Este projeto, vinculado ao Projeto Temático "História do Português Paulista", tem como objetivo central apresentar uma agenda para os estudos sintáticos dos primeiros séculos do Português Paulista (XVI e XVII). Paralelamente será apresentado um estudo dos mesmos fenômenos sintáticos em textos portugueses dos séculos XV, XVI e XVII. A agenda é composta pela análise da estrutura argumental e valência verbal, preposições, concordância verbal e nominal e estratégias de junção..

4. Projeto MaCLinC: Matemática, Computação, Linguagem e Cérebro

Descrição: Um dos maiores e mais urgentes desafios da comunidade científica do século 21 é processar, modelar e explicar a enorme massa dos dados produzidos nos laboratórios de pesquisa. Para isso são necessárias novas ideias e o desenvolvimento de novas estruturas matemáticas. O objetivo do Projeto-USP "Matemática, Computação, Linguagem e Cérebro" (MaCLinC) é alcançar uma compreensão teórica profunda de fenômenos centrais em linguística e em neurociência, através do desenvolvimento de novos modelos e resultados matemáticos. A escolha da linguística apoia-se em mais de 20 anos de experiência que fez do Numec um grupo internacionalmente reconhecido na modelagem matemática da aquisição e mudança linguística. Apoia-se também na existência do Corpus Histórico do Português Anotado Tycho Brahe. A neurociência é atualmente um campo em rápido desenvolvimento com uma clara necessidade de uma nova e original modelagem matemática. O campo é caracterizado por uma grande variedade de fenômenos envolvendo escalas muito diferentes e padrões de interação complexos. Essas características implicam que um tratamento eficiente dos dados e fenômenos passa necessariamente pela modelagem estocástica. Os modelos matemáticos e ferramentas já desenvolvidos por nossa equipe para o estudo de fenômenos linguísticos são candidatos naturais também para a análise de dados em neurociência. Com efeito, tanto os modelos linguísticos, quanto os modelos em neurociência são baseados em medidas de probabilidade definidas em grafos. No primeiro caso esses grafos são árvores de contextos representando dependências linguísticas. No segundo caso os modelos envolvem grafos mais complexos que descrevem a interação dos neurônios ou grupos de neurônios.Os resultados da equipe na área de seleção de modelos - tanto para modelos descritos por árvores de contextos, quanto para campos aleatórios apoiados em grafos de interação - oferecem uma base natural para futuros desenvolvimentos nessas áreas. Linguística e neurociência.


Grupos de Pesquisa

A língua portuguesa no tempo e no espaço

site / DGP

Etimologia da Língua Portuguesa

site / DGP

Gramáticas: história, descrição e discurso

site / DGP

História do Português Paulista

site / DGP

Humanidades Digitais

site / DGP


 

Email: mariaclara.ps@gmail.com

Currículo Lattes



Dr. Radut Consulting