Geocoding – بخش دوم (مفاهیم Geocoding)

۱- آدرس چیست ؟

یک آدرس روش ساده ای است که برای توصیف کردن یک مکان یا موقعیت استفاده می شود. بر خلاف یک مقدار مختصاتی، یک آدرس چگونگی مراجعه یک مکان بر اساس ویژگی های موجود در پایگاه داده GIS را توصیف می کند. در بسیاری از موارد این نحوه توصیف نسبتا برای درک کردن ساده می باشد. برای مثال اگر ما احتیاج داریم آدرس “۳۸۰ NewYork., Redlands,CA,92373″ را معلوم کنیم و موقعیت آن را با داده های صحیح خیابان مشخص کنیم، این موضوع زیاد برای پیدا کردن موقعیت دقیق طول نمی کشد. ما ممکن است ابتدا California، وسپس شهر Redlands را پیدا کنیم. ما همچنین ممکن است از یک نقشه کد های پستی استفاده کنیم ومنطقه پوشش داده شده به وسیله ZIP کد متناظر را مشخص کنیم. سپس ما خیابان مورد نظر را پیدا می کنیم، و در پایان توجیه می کنیم در کجا و در کدام طرف بلوک ۳۰۰ آدرس قرار می گیرد.

ا داشتن شبکه معابر و معرفی کردن پلاک های ابتدا و انتهای هر خیابان با استفاده از توابع خطی موقعیت آدرس روی شبکه معابر بدست می آید. و نحوه محاسبه آن بدین صورت است که پلاک های آخر منهای پلاک های داده شده ضربدر طول تقسیم بر اختلاف می شود و موقعیت به صورت خروجی نقطه روی نقشه نشان داده می شود. با استفاده از محدوده پلاک های زوج وفرد نیز سمتی که مکان قرار می گیرد در خیابان مشخص می شود.

 المان های آدرس

آدرس ها مشخصات مخصوصی دارند. یک ادرس شامل المان های معین آدرس است و در یک محدوده از فرمت ها معرفی می شود. وقتی که geocoding انجام می شود، فرمت آدرس تفسیر می شود والمان های آدرس شناسایی می شوند و با المان های در داده های مرجع مقایسه می شود.

 یک المان آدرس یک مؤلفه منحصربه فرد در آدرس است مثل شماره خانه، نام خیابان وکد پستی. المان های آدرس در جستجوی geocoding کمک می کنند و یک آدرس را به دقت به یک مکان خاص اشاره می کنند.

فرمت های آدرس

آدرس ها در یک محدوده گسترده از فرمت ها نمایش داده می شوند. یک فرمت عمومی استفاده شده در آمریکا شامل المان های آدرس: شماره خانه، اسم خیابان، نوع خیابان و اطلاعات زون مثل شهر، استان وZIP code.

ر بسیاری از مناطق، آدرس ها با فرمت های مختلف معرفی می شوند. یک مثال از این فرمت های دیگر، فرمت استفاده شده در Queens,NewYotk است.

ین فرمت آدرس شامل یک مقدار عددی اضافی است که نزدیکترین تقاطع خیابان را نشان می دهد. همانند این فرمت، فرمت های دیگر در مناطق مختلف دیگر وجود دارد.

 یکی دیگر از این فرمت های که در آمریکا است می تواند در مناطق Wisconsin.Illinois پیدا شود. در این مناطق فرمت آدرس یک المان آدرس “grid zone” را شامل می شود. یک “grid zone” به صورت ساده یک بلوک بزرگتر یا گریدی که آدرس در آن قرار می گیرد می باشد. شماره خانه متناظر در خیابان بر اساس مکان و بلوک مخصوص خیابان واگذار می شود. مقدار “grid zone” به اشاره کردن شماره خیابان به یک zone مخصوص در داخل جامعه کمک می کند.

آدرس های بین المللی نیز می تواند در یک محدوده از فرمت ها معرفی بشوند. برای مثال یک آدرس برزیلی متعارف بیشتر المان های آدرس پایه را شامل می شود، اگر چه آن ها در یک الگوی مختصری متفاوت قرار می گیرند. همچنین گاهی استان یا ایالت خاص را به طور مستقیم مشخص نمی کنیم.به هر حال این مساله می تواند از کد پستی یا شهر مشخص شود.

بدلیل بعضی تغییرات در زبان، این مساله ممکن است که المان های آدرس معلوم حذف بشوند. برای مثال، در آلمان، اسم خیابان به علاوه نوع خیابان می تواند به یک ترم ملحق شوند. درک کردن زبان وعرف های یک منطقه به صورت خیلی زیاد تفسیر فرمت های نا آشنا را آسان می کند.

ر حالی که همه این آدرس ها در بعضی درجه ها فرق دارند، بعضی چیز ها ثابت باقی می مانند. هر آدرس شامل چند المان آدرس می باشد که در یک فرمت آدرس مخصوص معرفی شده است و برای آنهایی که در منطقه اند شناخته شده است. درک کردن آن همه آدرس ها شامل المان های آدرس مخصوص در درک کردن پروسه geocoding وترجمه نیاز شده به وسیله هر قانون پایه geocoding مخصوص برای تفسیر کردن کمتر فرمت های آدرس متعارف کمک می کند.

 ۲- جریان کاری geocoding

برای geocoding چندین مرحله مختلف وجود دارد که باید پیروی شود. این مراحل به عنوان جریان کاری geocoding منسوب می شوند و در زیر به صورت خلاصه بیان می شود.

 ۲-۱- درست کردن یا کسب کردن داده های مرجع

در ابتدا، پروسه  geocodingدو نوع از اطلاعات را نیاز دارد :داده های مرجع وداده های آدرس. داده های مرجع به یک کلاس عوارض GIS منسوب می شود که صفات آدرسی که ما برای جستجو می خواهیم در برمی گیرد. برای مثال، وقتی که برای آدرس شماره خانه جستجو می کنیم، متریال اصلی باید شامل اسم های خیابان، رنج های شماره خانه ها یا صفات آدرس پارسل های ویژه باشد.داده های مرجعی که ما برای پروسه geocoding به کار خواهیم گرفت یک سری ملاحظات وجود دارد که ما برای ساختن بر اساس وسعت وقدرت تجزیه وتحلیل داده ها به آن نیاز داریم.

داده های مرجع لزوما باید منطقه یکسانی را که ما می خواهیم geocode کنیم را بپوشاند. برای مثال اگر ما برای geocode کردن شهرهای تمام آمریکا تلاش می کنیم، داده های مرجع که فقط عوارض در ایالات غربی را ارائه می دهد کارآیی این کار را ندارد. هر آدرس که ما می خواهیم geocode کنیم باید در داده های مرجع معرفی شده باشد. این مساله ما را به ویژگی دوم داده های مرجع یعنی resolution راهنمایی می کند.

اگر داده ها یک پوشش مکانی داشته باشند که همه عوارض دلخواه ما برای geocode کردن را شامل شود، ما باید همچنین ملاحظه کنیم که داده های مرجع اطلاعات در سطح جزییات که ما برای جستجو کردن می خواهیم داشته باشند.اگر ما بخواهیم آدرس های منحصربه فردی را geocode کنیم، احتیاج داریم مطمئن بشویم که داده های مرجع ما اطلاعات در آن سطح را داشته باشند. اگر داده های ما فقط اسم های خیابان را در بر بگیرند، ومحدوده های آدرس برای هر بخش از خیابان را نداشته باشد، ما در نشان دادن مکان دقیق در طول آن خیایان که آدرس در آن قرار گرفته است ناتوان خواهیم بود.

۲-۲- تعیین کردن روش address locator

داده های آدرس نیاز دارد مطابق با فرمت های معین باشد. نیازهای خاص داده های آدرس بر اساس المان های روش address locatorای که ما قصد داریم استفاده کنیم می باشد. به عبارت کلی داده های آدرس نیاز دارد المان های مطلوب استفاده شده در منطبق کردن یک آدرس به یک عارضه را در بر بگیرد و در یک فرمت قابل قبول باشد.

ه منظور geocode کردن به صورت درست وصحیح، این مساله برای درک کردن تنوع روش های address locator وانتخاب کردن یکی از این روش ها که بهترین انطباق با آدرس ما و داده های مرجع ما  را دارد مهم است.

-۳- ساختن یک Address locator

یک مرتبه روش Adress locator تصمیم گرفته شده و داده های مرجع و داده های آدرس برای آن روش آماده شده است، ما برای ساختن یک address locator آماده می شویم. برای ساختن یک address locator می توانیم در بخش بعدی مراحل وجزئیات آن را ببینیم.

 ۲-۴- تعیین محل کردن آدرس ها

ArcGIS دو روش را برای تعیین محل کردن آدرس ها فراهم می کند، ما می توانیم آدرس های تکی را پیدا کنیم یا می توانیم مکان برای یک جدول از آدرس ها را پیدا کنیم که به طور متعارف به عنوان “batch geocoding” منسوب می شود.

ArcGIS هر آدرس استاندارد شده را از جدول آدرس گرفته، به جستجوی عوارض در داده های مرجع با قسمت های تطبیقی می پردازد. برای هر آدرس، لیستی از موقعیت های تطبیقی ممکن یا احتمالی، در داده های مرجع تولید می کند که کاندید (candidate) نامیده می شود. هر کاندید امتیازی می گیرد که مرتبط با احتمال قرار گیری آن در موقعیت صحیح  آن است. برای انجام تطبیق وساخت عوارض نقطه ای در ArcGIS، امتیاز هر کاندیدا باید به مقدار معینی برسد.

 ما می توانیم هر دو امتیاز تعریف شده را انتخاب کنیم، امتیازی که یک موقعیت را به عنوان کاندیدا تعیین کرده ویا امتیازی که یک کاندیدا را به عنوان تطبیق تعیین می کند.

 چندین مرحله پایه ای برای تعیین محل کردن آدرس ها وجود دارد که در این قسمت به آن اشاره نمیکنیم و در بخش ۴-۲ به بررسی آن ها می پردازیم. به طور ذاتی این پروسه شامل پیدا کردن مکان های کاندید در داده های مرجع و واگذار کردن امتیاز انطباق به مکان ها و مشخص کردن بهترین کاندید است. نحوه انجام تطبیق دهی آدرس ها در بخش ۴-۲ به صورت کامل آمده است.

 ۲-۵- انتشار دادن، نگهداری کردن، بهبود دادن Address locator

یکمرتبه که یک Address locator ساختیم، چندین کار اختیاری ممکن است انجام دهیم. این شامل به اشتراک گذاشتن یا انتشار دادن Address locator، نگهداری کردن داده های مرجع وAddreaa locator وابسته، وبهبود دادن user interface یا عاملیت address locator است.

 ۲-۵-۱- انتشار دادن address locator

یکی از کارهای متعارف توزیع یک Adress locator است.  یک محدوده گسترده از روش ها برای توزیع کردن یک Address locator وجود دارد. این ها شامل به اشتراک گذاشتن متریال روی یک شبکه محلی، دوباره تولید کردن یکAdress locator و فایل های وابسته روی یک دیسک فشرده یا در یک فایل داده فشرده شده و تولید کردن یک سرویس geocoding تحت وب است.

 ۲-۵-۲- نگهداری کردن Address locator

وقتی که ابتدا یک Address locator می سازیم، شاخص های geocoding حالت داده های مرجع را در لحظه ساختن منعکس می کنند. هر چند مانند بیشتر فایل های داده، داده های مرجع ما ممکن است نیاز به update کردن به صورت تکراری داشته باشند.

اضافه کردن خیابان ها به مجموعه داده ها،تغییر دادن اسامی خیابان ها، یا به طور ساده بهبود دادن دقت هندسی عوارض با اصلاح داده های مرجع geocoding. وقتی که این تغییرات داده های مرجع وارد می شود شاخص های geocoding نیز احتیاج به update برای منعکس کردن این تغییرات دارند.

 ۲-۵-۳- بهبود دادن المان ها در Adress locator

تعدادی روش که می تواند برای اصلاح جستجوی ما استفاده بشود وجود دارد. درجه ای که ما محدوده جستجویمان را تغییر می دهیم از تغییرات پایه در جعبه دو طرف (dialog box) Adress locatorتا دوباره تعریف کردن قانون پایه ما است.

 ۳- چهارچوب Geocoding

 ۳-۱- geocoding user interface

شاید یکی از آشنا ترین مؤلفه های geocoding، geocoding user interface است. ArcGIS شامل دو کارکرد بسیار بزرگ است، Arccatalog,Arcmap است. تعداد زیادی از اصطلاحات و وظایف وتوابع geocoding می تواند از میان جعبه دو طرفه (dialog box) یا ابزار های در دسترس در Arcmaop و Arccatalog انجام شود. جعبه دو طرفه اولیه استفاده شده درgeocoding آنهایی هستند که برای ساختن، تنظیم کردن و اجرا کردن پروسه geocoding است. ساختن و تنظیم برای یک  address locator در Arccatalog ساخته می شود.

۳-۲- Address locator

یک   Address locator ترکیب داده های مرجع ویژه – مکان و راهنمای ویژه – روش معین بر اساس روش Address locator انتخاب شده است. این Address locator نهادی است که روش تفسیر کردن یک نوع خاص از آدرس است وآدرس را با داده های مرجع از پیش تعریف شده باز گو می کند. و یک نوع معین از خروجی را به user interface‌ بر می گرداند.

 روش Adress locator اسکلت یک Addess locator است. جزییات ایجاد یک Address locator در بخش بعدی آمده است.

 ۳-۳- قانون پایه

قانون پایه یک مجموعه از فایل های استفاده شده برای انتقال داده های آدرس به خروجی مطلوب است. برای هر روش Address locator، فایل های خاص در قانون پایه استفاده شده در این انتقال برای پیدا کردن ویژگی ها در داده های مرجع که ویژگی های آدرس را منطبق می کند وجود دارد.

Geocoding – بخش اول (مقدمه ای بر Geocoding)


Geocoding پروسه واگذاری یک مکان یا موقعیت معمولا در فرم مقادیر مختصاتی به یک آدرس به وسیله مقایسه کردن المانهای توصیفی مکان در آدرس با آن هایی که در متریال مرجع حاضر است می باشد. یا به عبارت ساده تر مراحل و فرآیند ایجاد عوارض نقشه از آدرس ها،نام مکان ها یا اطلاعاتی غیر مکانی از این قبیل، geocoding نامیده می شود. ارزش geocoding دز این است که امکان می دهد موقعیت های مختلف در نقشه، از طریق داده ها به سهولت در دسترس وقابل شناسایی باشد.

آدرس ها می توانند در فرمت ها و شکل های گوناگونی باشند، مانند فرمت های آدرس معمولی از شماره خانه که به وسیله نام خیابان متابعت می شود واطلاعات بعدی به توصیفات مکانی دیگر مثل منطقه پستی یا حوزه آماری. به عبارتی ادرس شامل نوعی از اطلاعات است که یک مکان را متمایز می کند.

Geocoding در کاربردهای مختلف از آنالیز ساده داده ها تا تجارت ومدیریت مشتری می تواند استفاده شود. با آدرس های geocode شده ما میتوانیم مکان آدرس را به صورت موقعیتی یا مکانی نمایش دهیم والگوها را در داخل اطلاعات شناسایی کنیم. این می تواند به وسیله جستجو کردن ساده در اطلاعات یا به وسیله استفاده کردن بعضی ازابزار های  در دسترس با ArcGIS انجام شود. ما همچنین اطلاعات ادرس را بر اساس پارامترهای معین برای اجازه دادن برای آنالیز کردن بیشتر اطلاعات نمایش دهیم.

مرحله اول وقتی که ما می خواهیم یک چیزی را از روی نقشه پیدا کنیم داشتن یک نقشه صحیح است. یعنی نقشه ما باید جزئیات کافی منطقه برای اشاره دقیق به آنچیزی که ما جستتجو می کنیم داشته باشد. مثلا فرض کنیم ما به دنبال یک ادرس می گردیم و نقشه ما جزئیات اتوبان ها وشهر های بزرگ را دارد وآدرس ما به صورت ۳۸۰ NewYork street in Redlands,California است وبنابراین با داشتن این نقشه هیچ روشی برای پیدا کردن دقیق آدرس وجود ندارد چون جزئیات کافی روی نقشه برای این کاربرد وجود ندارد.بنابراین لایه هایی که ما استفاده می کنیم وبه عنوان داده های مرجع معلوم هستند باید جزدیاتی که ما انتظار داریم را داشته باشند. وقتی که ما می خواهیم جستجوی آدرس را انجام دهیم، داده مرجع اولیه معمولا شامل یک شبکه از خیابان است اما یک نقشه پارسل نیز می تواند به خوبی استفاده شود. بنابراین مهمترین مساله این است که داده ها جزئیاتی که ما می خواهیم پیدا کنیم را داشته باشد.

برای انجام geocoding، یه جدول آدرس ها (لیستی از آدزس های ذخیره شده به صورت جدول پایگاه یا فایل نوشتاری) ونیز به مجموعهای از داده های مرجع (همانند معابر) که می توان روی آن آدرس ها را مشخص کرد نیاز داریم. ArcGIS برای اینکه معین کند موقعیت آدرس ها در کجا است از اطلاعات آدرس ها در جدول توصیفی داده های مرجع استفاده می کند.

علاوه بر یک جدول آدرس و داده های مرجع، geocoding نیازمند یک مکان یاب بر اساس  آدرس (Address locator) نیز است.

 تعریف “مکانیاب بر اساس آدرس”(Address locator)

 Address locator یک ابزار اصلی برای geocoding در ArcGIS است. یک Address locator فایلی است که به یک تعداد دیگر از منابع مانند داده های مرجع، موتور geocoding وقانون پایه geocoding اشاره دارد یا به عبارت دیگر فایلی است که توصیف کننده داده های مرجع واطلاعات توصیفی مناسب آن بوده (اطلاعات مناسب از جدول آدرس) و همچنین دارای قواعد مختلف geocoding و تقریبات می باشد.

روش های مختلف Address locator وجود دارد، انتخاب کردن درست یکی از این روش ها بستگی به نوع داده های مرجع واین مساله که آدرس های ما در چه فرمتی باشد دارد.

موتور geocoding نیروی محرک پشت سر پروسه است، که اطلاعات مختلف را به هر کجا که آن نیاز دارد و برای اجرا کردن پروسه نیاز دارد می فرستد. قانون پایه geocoding یک مجموعه از فایل هایی است که دستور می دهد چگونه آدرس مخصوص ما ترجمه بشود، فایل های مختلفی در قانون پایه استفاده می شود که بستگی به فرمت داده های مرجع و نوع آدرسی که ما سعی می کنیم آن را پیدا کنیم دارد.

Geocoding با ایجاد یک Address locator آغاز می شود. Address locator ها به روش های مختلفی آورده می شوند تا برای هر داده مرجع، مناسب با اطلاعات توصیفی مختلف به کار گرفته شوند، برای مثال روشی که single field نامیده می شود تنها برای داده های مرجع که شامل یک فیلد توصیفی منفرد از اطلاعات جغرافیایی است مورد استفاده قرار می گیرد. در نقشه ها برای نونه ممکن است این فیلد نام ایالت باشد. داده های geocode شده می تواند در ایالت صحیح قرار گیرد اما نه با دقت بیشتر از آن.

روش دیگر Address locator که ZIP نامیده می شود با داده های مرجعی کاربرد دارد که دارای یک فیلد توصیفی ZIP کد باشد.

روش US Street با داده های مرجع معبری استفاده می شود که دارای فیلدهای توصیفی نام معبر و همچنین دارای ابتدا وانتهای محدوده های آدرس برای هر طرف از یک معبر است. جدولی از آدزس ها می تواند با موقعیت های تقریبی در طول یک معبر و در طرف صحیح آن معبر، geocode شود. هر روش Address locator نیازمند این است که همان اطلاعات توصیفی معین در جدول آدرس آن به خوبی ارایه شده باشد.