Sqlserver
 sql >> база данни >  >> RDS >> Sqlserver

Анализирайте използваемия адрес, град, щат, пощенски код от низ

Свърших много работа по този вид анализ. Тъй като има грешки, няма да получите 100% точност, но има няколко неща, които можете да направите, за да стигнете по-голямата част от пътя, и след това направете визуален BS тест. Ето общия начин да го направите. Това не е код, защото е доста академично да се напише, няма странности, само много обработка на низове.

(Сега, след като публикувахте някои примерни данни, направих някои малки промени)

  1. Работете назад. Започнете от пощенския код, който ще бъде близо до края, и в един от двата известни формата:XXXXX или XXXXX-XXXX. Ако това не се появи, можете да приемете, че сте в града, щатската част по-долу.
  2. Следващото нещо, преди zip, ще бъде състоянието и то ще бъде или в двубуквен формат, или като думи. Знаете какви ще бъдат и тези - има само 50 от тях. Освен това можете да озвучите думите, за да компенсирате правописните грешки.
  3. преди това е градът и е вероятно на една линия с държавата. Можете да използвате база данни с пощенски кодове за да проверите града и щата въз основа на zip или поне да го използвате като BS детектор.
  4. Адресът обикновено е един или два реда. Вторият ред обикновено ще бъде номерът на апартамента, ако има такъв, но може да бъде и пощенска кутия.
  5. Ще бъде почти невъзможно да откриете име на първия или втория ред, но ако то не е с префикс номер (или ако е с префикс "attn:" или "attention to:", може да ви даде подсказка дали е име или адресен ред.

Надявам се това да помогне донякъде.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Каква е добра идея за запазване на данни от чат в база данни?

  2. Как да копирам дълбоко набор от данни и да променя FK препратките, за да сочат към всички копия?

  3. намерете променлива дължина за sql сървър тип данни nvarchar от c# код

  4. MultipleActiveResultSets=Истински или множество връзки?

  5. Не може да се компилира SSIS компонент; Липсващо сглобяване във Visual Studio 2008