<div dir="auto">Boa noite,<div dir="auto"><br></div><div dir="auto">Tenho em mãos um desafio de normalizar uma base de dados com mais de um milhão e meio de registos que têm moradas associadas.</div><div dir="auto">Os objetivos principais é normalizar as moradas corretamente, ex. Formato utilizados CTT, representar esses pontos através de coordenadas wgs84(GPS).</div><div dir="auto">Visto ser uma base de dados com mais de 10 anos de existência, de início não foram definidos alguns processos que limitassem as inserções de dados( ex. Campos de texto livre) e por isso tem muitos erros.</div><div dir="auto">Localidade: 'Feira', 'st feira', 'santa mr. Feira'...</div><div dir="auto"> Latitude: '42.112412' outras vezes 'N. 42.112412' coordenadas a apontar para o meio do Atlântico, entre outros.</div><div dir="auto"><br></div><div dir="auto">Estou a pensar utilizar o data quality services (DQS) e também geocoding com recurso à API do Google Maps, visto já ter visto vários ficheiros Excel ou semelhante. </div><div dir="auto">Alguem que já tenha tido um desafio semelhante?</div><div dir="auto">Recomendem outro tipo de abordagem?</div><div dir="auto">Aceito sugestões :)</div><div dir="auto"><br></div><div dir="auto">Obrigado!</div><div dir="auto"><br></div><div dir="auto">Cumprimentos,</div><div dir="auto">Marco</div></div>