ماشین های روز دنیا - جدیدترین اتوموبیل ها و خودرو

ماشین های جدید شیک و بروز با ظاهر متفاوت خودرو و برندهای معروف در صنعت خودرو سازی،خودرو هیبریدی،خودرو آب سوز ب- خودرو برقی...

ماشین های روز دنیا - جدیدترین اتوموبیل ها و خودرو

ماشین های جدید شیک و بروز با ظاهر متفاوت خودرو و برندهای معروف در صنعت خودرو سازی،خودرو هیبریدی،خودرو آب سوز ب- خودرو برقی...

  • ۰
  • ۰

پایان نامه gl/l (1170)

اگر هدف متصل کردن پردازشگرهای بیشتری به هم است بنابراین طراحان کامپیوتری بایست بیشتر از یک باس واحد استفاده کنند .

و این به ما یک بحث قدیمی دوباره سازمان حافظه در مقیاس بزرگ پردازش های موازی را نتیجه می دهد . متاسفانه اغلب بحث به یک دوگانگی غلط متمرکزمی شود : حافظه مشترک در برابر حافظه توزیع شده . حافظه مشترک که در واقع به معنی یک فضا با آدرس واحد است که به طور ضمنی به ارتباطات با بارگذاری و ذخیره دلالت می کند .

سازمان شبکه های چند پردازشگر ، توجه : برخلاف شکل 902 اتصالات چند پردازشگر ها بلند تر :908 و شکل از بین حافظه و پردازشگرهانیست . همچنین پردازشگرها بایک شبکه در بالای حافظه ساخته شده اند . شاید بهترین مثال : ctayxmp , yamp sun Enterprise جدید ترین مثال باشند .

در مقابل یک نشانی حافظه های چند گانه خاص وجود دارد که به ارتباط صریح بین ارسال ها و دریافت ها دلالت می کند .

حافظه های توزیع شده به قسمت های فیزیکی حافظه بر می گردد . اگر حافظه فیزیکی به چند قسمت تقسیم شود و کنار هر قسمت هم یک پرداز شگر باشد مثل شکل 8 . و در آنصورت حافظه فیزیکی توزیع شده خواهد بود .

دقیقا برعکس حافظه توزیع شده حافظه متمرکز است . جایکه زمان دسترسی به حافظه فیزیکی برای همه پرداز شگرها برابر است چون هر دسترسی از طریق اتصال شکل 902 انجام می شود . بعضی وقتها به این نوع ماشین سالن رقص می گویند .

که پردازشگرها در یک طرف سالن و حافظه ها در طرف دیگر مانند مدرسه رقص که پسرها در طرف اتاق و دخترها در طرف دیگر هستند . ( به عنوان مثال کامپیوتر ترا ، رجوع شود به www. mkp. cem / coze. htm ) . همانطور که در قسمت 901 گفته شد . فضای یک نشانی در برابر فضای نشانی چند گانه و حافظه توزیع شده در برابر حافظه متمرکز شده متمم یکدیگرند : چند پردازشگرها می توانند یک فضای تک نشانی و یک حافظه فیزیکی توزیع شده داشته باشند . بحث مناسب اهمیت جنبه های مثبت و منفی فضای یک نشانی از ارتباطات روشن و از حافظه های فیزیکی توزیع شده را مشخص می کند .

در ماشین ها بدون یک نشانی ، ارتباطات واقع است . برنامه نویس و کامپایلو می بایست پیغام ها را یک گره بفرستد و از گره دیگری پیغامها را دریافت کنند .

شکل 909 : خصوصیات کامپیوترهای چند پردازشگر متصل باشد شبکه برای فروش در سال 1997

برنامه های موازی ( پیغام های عبوری )

بیایید درباره یک شبکه با اتصالات چند پردازشگر 100 پردازنده ای که از حافظه های چند گانه خاص استفاده می کند بزنیم .

جواب : چون این کامپیوتر فضای چند نشانی دارد ، اولین قدم توزیع 100 زیر مجموعه به هر کدام از حافظه های جزئی است . پردازشگر شامل 000/100 شماره ارسالی زیر مجموعه به هر کدام از 100 گره حافظه پردازش است .

مرحله بعدی بدست آوردن حاصل جمع هر کدام از زیر مجموعه هاست . مرحله مشکل آن ، این است که هر کدام از حاصل جمع های جزئی در یک واحد اجرای مختلف واقع شدند . بنابراین ما باید از یک شبکه به هم پیوسته برای ارسال حاصل جمع های جزئی استفاده کنیم تا حاصل جمع نهایی ذخیره شود . علاوه بر ارسال همه حاصل جمع های جزئی به یک پردازشگر واحدی که براساس جمع های متوالی حاصل جمع های جزئی نتیجه می دهد ما تقسیم می کنیم تا موفق شویم . اول نیمی از واحد اجرا حاصل جمع های جزئی را به نیمه دیگری فرستد جایکه دو حاصل جمع جزئی با هم جمع می شوند . سپس یک چهارم واحد اجرا ( نصفی از نصف ) یک حاصل جمع جزئی جدید را به یک چهارم بعدی می فرستد تا مرحله بعدی جمع انجام شود . این تقسیم کردن ها و ارسال و دریافتها تا زمانیکه یک حاصلجمع از همه اعداد بدست آید . ادامه می یابد . فرض کنید pn نمایانگر شماره واحدهای اجرا باشد send/ x,gk تابعی است که شماره x را با مقدار y از شبکه به واحد اجرا ارسال می کند و ()receive یک تابعی است که یک مقدار را از شبکه برای واحد اجرا می گیرد .

این که همه پردازشگرها به دو دسته فرستنده و گیرنده تقسیم می کند و هر کدام از پردازشگرهای گیرنده فقط یک پیغام دریافت می کنند پس ما میتوانیم فرض کنیم یک پردازشگر گیرنده تا وقتی که دریافت می کند ، ممانعت می کند . بنابراین ارسال و دریافت می توانند به عنوان همزمان سازی خاص باری ارتباطات به کار روند . همانگونه پردازشگر ها از انتقال 9 داده ها آگاهند .

طریقه آدرس دهی پردازشگرهای موازی در مقیاس بزرگ :

اغلب پردازشگرهای تجاری در مقیاس گسترده از حافظه توضیع شده استفاده می کنند . هر چند که ساخت ماشینی که بتواند با ازدیاد و ارتقاء پردازشگرهایش حافظه آن هم افزایش و ارتقاء پیدا کند ، یا خیلی مشکل است یا گرانقیمت .

مسئله جدی که دررابطه با ماشین ها ی توضیع حافظه در مقابل طراحان وجود دارد ، مسئله ارتباطات آن است . برای سازندگان سخت افزاری ساده ترین راه حل استفاده از ارتباط فرستادن و دریافت بجای ارتباط ضمنی می باشد که این امر در صورتیکه بعنوان جزئی از بارگزاری یا ذخیره استفاده گر در امکان پذیر است . فرستادن و دریافت هم چنین مزیتی هم دارد که سادگی طرح ارتباط سیستم برای برنامه نویس می باشد . و طریقه محاسبه با استفاده از ارتباط صریح آسانتر از ارتباط مجازی ( تلویحی ) بارگزاری یا ذخیره ای . یا به عبارت دیگر بارگزاری و ذخیره بمراتب از ارتباط پائین تری از نوع فرستادن و دریافت دارد . بعضی از کاربردها اطلاعتشان در دور دست قرار دارد که بصورت گه گاهی و غیر قابل پیش بینی بدست می آید ، بنابراین خیلی مفید خواهد بود که برای اطلاعات دور دست آدرسی تعیین گردد . بجای اینکه آنها را دریافت کنید ، از نظر اینکه ممکن است مورد استفاده قرار گیرد . چنین ماشینی دارای حافظه اشتراکی توضیعی می باشد . ( بنام DSM )

وجه اشتراک سخت افزار نرم افزار :

اضاف کردن یک لایه سخت افزاری روی ارسال و دریافت بمنظور ایجاد فضای آدرس مجزا برای برقراری ارتباط ،کار مشکلی است ، همچنین این عمل تا قیاس با سیستم های حافظه حقیقی که در حال حاضر در اکثر پردازشگرها وجود دارد می باشد .( فصل 7 ) . در حافظه های حقیقی پردازشگرواحدی از فهرست برای تشخیص آدرس استفاده می کند که آدرس داده شده را تشخیص دهد که آیا داخلی است یا از دیسکت داده شده ؟ این سیستم تشخیص می تواند بگونه ای ارتقاء داده شود که بتواند تصمیم گیری کند که اطلاعات داخلی یا دیسکت یا پردازشگردیگری دریافت می شود .

ایجاد حافظه مجازی بقدری دقیق است که کاملا شبیه حافضه واقعی تصور می شود و اجرای عملیات بقدری کند است که استفاده از آن طریق اغلب بمنزله وقت تلف کردن است ، یا شبیه ورق زدن صفحات .

ارتباط چگونه برقرار شده اهمیتی ندارد ، مهم اینست که کش ها اجرا شوند بنابراین ما میخواهیم به اطلاعات مشترک اجازه بدهیم که به همان خوبی که از طریق پردازشگر در خواست شده اند در کش پردازشگر مربوطه نیز ظاهر گردند .

بنابراین یک سیگنال آدرس در شبکه ایکه به چند پردازشگر متصل است . شاخه های کش های متصل بهم را فعال می کند ، چونکه تعداد زیادی کپی از همان آدرسها در پردازشگرهای مختلفی وجود دارند . مسلما باس – اسنوپینگ های شرح داده شده در فصل 3-9 در اینجا صدق نمی کند ، چونکه باس واحدی وجود ندارد که تمام حافظه ها را در حال کار قرار دهد . بدلیل اینکه طراح CRay T3e هیچگونه باس در اختیار نداشت که کشهای متصل بهم را حمایت کند ، T3E یک فضا برای آدرسها دارد اما این فضا کش – کوهر نت نمی باشد .

یک راه حل برای باس اسنوپینگ در کش – کوهرنت دایرکتوری ها هستند . بر اساس قرار دادها ، بیگ دایرکتوری واحد وجود داردکه حالت هر بلوک را در حافظه اصلی حفظ می کند . اطلاعات موجود دردایکتوری حاوی اینست که کدام کش کپی های پلاک مربوطه را دارد ؟ آیا آنها قابل استفاده اند ؟ و ازین قبیل . خوشبختانه ورودی های دایکتوری ها می تواند طوری تقسیم گردد که درخواستهای مختلف به حافظه پای مربوطه بروند ، که نتیجتا باعث کاهش اتصالات که باعث ساخت یک طرح متناسب می گردد . دایرکتوری ها خواص که باید همیشه حالتهای مشترک را دریک محل نگهدارند در خود حفظ کرده و باعث ساخت پردازشگرهای موازی بزرگ زیبا میگردند .

طراحان کش اسنوپینگ و دایرکتوریها به انتشارات مشابهی رسیدند و تنهااختلاف در مکانیزم تشخیص اطلاعات پیش می آید . بجای اینکه باس را تماشا کند که به بیند آیا در خواستی در مورد بروز کردن کش محلی یا از اعتبار خارج کردن آن وجود دارد ، کنترل کننده دایرکتوری یک پیام قطعی به پردازشگرکش که حاوی یک کپی از اطلاعات است میفرستد . چنین پیامهایی بعدا می توانند از طریق شبکه فرستاده شوند .

شکل 909 خواص تعدادی از بید دایرکتوری و پردازشگرهای غیر هم فرم موجود را نشان می دهد .

شجره : با یک سیگنال آدرس ، اطلاعات می توانند بصورت بطور دلخواه در حافظه های پرداشگرهای مختلف قرار داده شوند . این کار دو نتیجه منفی دارد : اولی اینست که خطای از دست دادن طولانی خواهد بود ، چونکه درخواست باید تمام شبکه را طی کند . دومی اینست که پهنای باند شبکه تمام بکار گرفته می شود که اطلاعت را به پردازشگر مربوطه برساند .

برای برنامه هائیکه میزان خطای پائینی دارند ازین نوع دستگاه ممکن است مناسب نباشد .

یا به عبارت دیگر برنامه های با میزان خطای بالا از میزان اجرای پائین برخودار خواهند بود . زمانیکه اطلاعات بصورت انتخاب گردند .

اگر پروگرامی یا کمپایلی اطلاعات را به پردازشگر واگذار نمایند که شبیه آنست که آنرا بکار ببرند ( مصرف کنند ) ، بعدا این نقص اجرائی تایید می شود . برخلاف حافظه سازمان ماشین های خصوصی این واگذاری فقط کافی است خوب باشد چونکه از دست دادن اطلاعات هنوز می تواند در آنها نکته منفی بشمار آید .

یک راه حل دیگر اضافه کردن یک سری کوهرنت به حافظه اصلی برای پردازشگر است . این دستور بلاک های حافظه اصلی را وادار به جابجائی خواهد کرد ، که باعث آزاد شدن کمپایلر یا پروگرامی حافظه اصلی در اختصاص دادن خواهد شده تا زمانیکه بلاک های حافظه تناوبا جلو و عقب نروند ، این طرح ممکن است از نظر قیمت و پیچیدگی گارنتر از قبلی ها باشد ولی از نظر ایمنی اطلاعات مناسبتر خواهد بود . که به آن کش فقط حافظه گویند . این تغییر محل می تواند در سطح صفحه بوسیله سیستم ظاهر شود یا می توانیم انجام آن را در سخت افزار هم ممکن بدانیم .

شکل 9015 اختیارات کوهرنتی را برای یک فضای یک آدرسی خلاصه کرده است .

بدلیل اینکه تعداد بین را نسبت به چیپ ها محدودند ، تمام پردازشگرها نمی توانند مستقیما در یک شبکه متصل شوند . این محدودیت باعث بوجود آمدن یک توهم در نقطه نظرهای مطرح و نقشه یک شبکه گردیده است . در شکل 906 خواص تعدادی از راههای متفاوت برای طراحی نشان داده شده است . اما بهتر است اول توجهی به طریق دیگری ازاتصال کامپیوترها بوسیله شبکه گردد .

نمودار 9011 هزینه اجرای چند پردازشگر را بطریق اتصال باس بنام UMR را با طریق اتصال شبکه ای بنام NUMA رانمایش میدهد .

درین نمودار شبکه هزینه کمتری دارد ومبدا زیاد میشود ( بسرعت ) در مقایسه با طریقه اتصال باس اجرا: برای هر دو به صورت خطی است تا اینکه طریقه باس به محدودیت خود میرسد و بعد اجرا سقوط کرده و اهمیتب ندارد که چه تعداد پردازشگر بکار گرفته شده . بعدا این دواثر با هم ترکیب می شوند و می بینیم که شبکه ایکه بصورت NUMA متصل گردیده با هزینه مربوطه خود همخوانی دارد . در صورتیکه اتصال بصورت باس یک سویت اسپاتی دارند که باعث جذب مشتری شده وطراحان برای این جاذبه بیشتر تمایل دارند از طریق باس استفاده کنند .

905 clusters :

« کاپرو برنده خواهد شد بدلیل اینکه کامپیوتر نمی تواند در یکسال آنهمه ارتقاء پیدا کند ( توسعه یابد ) »

گفته های والو قبل از شروع مسابقه بین کاسپرو و دیپ بلو روز 6 فی سال 1997

تقاضاهای زیادی برای مین فرم ها وجود دارند مانند داتابیس ، فیل سرو ، وب سرو ، سیمولیشن و ملتی پروگامینگ ، بس پروسینگ بیشتر است که با ماشینهای کم کار کند .

تا با ماشینهای کش کوهرنت NUMA که در بخش قبل مورد بحث قرار گرفتند .

این تقاضا سیستم ها اکثرا باید از اعتبار بالائی برخوردار بوده و حداقل خطا یا ایراد را دارا بوده و قابلیت تعمیر آنهم بالا باشد .

چنین سیستم هایی با شباهتی که مولتی پروسسورشان با قبلی ها دارد و هم چنین از نظر نیاز خودی به باند بالا ، سویچ بیس ، منطقه تحت پوشش شبکه ، از جحیت دارند و بنظر میرسد که پردازشگر های بزرگ آینده ممکن از کلاسترهائی بنام آف د شلف استفاده کنند . بالاترین مثال درین رابطه IBMSPZX که یک کلاستر 32 ناد است بالا شباهت زیادی به 000 6 /RS و رک استیشن که برای مسابقات شطرنج با سخت افزار با سرعت ساخته شده دارد .

مثلا در 1977 یک کلاستر دسک تاپ looultra spare بر کلی انگلستان با 160MB/SEC perlink switchesdutBSa بکار گرفته شد که امتیازات جهانی را ثبت کند که قدرت ذخیره اش 806 روی دیسک در دو دقیقه بود و اگر بخواهیم پیام را کنیم 5/3 ساعت برای 40-di DESKey طول میکشد .

دستگاه بالا با استفاده از قطعات آف دشلف ساخته شد و گاها داخل کیس ساخته میشود .

جدول 12: 9 فروش کلاستر را مانند IBM نشان میدهد .

این کمپانیها کلاستر را ساخته اند بمنظور اینکه قابل ازتقاء سیستم با ارزش ( معتبر ) که درینصورت سیستمی است که هدفش ضمن ارتقاء توانائی از تعداد زیاد پردازشگر ، حافظه و دیسک برخوردار بوده و هم چنین بتواند بصورت 24 ساعته و تمام سال آماده و در حال کار باشد .

یک نقطه ضعف کلاستر هزینه سیستم مدیریتی آن است ، یک کلاستر با N عدد ماشین همان هزینه ای را دارد که NS ماشین مستقل داشته باشد . در صورتیکه مدیریت سیستم shared address space muitioros… با N عدد ماشین هزینه ای معادل سیستم از نوع خودش فقط با یک ماشین خواهد داشت .

نقطه ضعف دیگر اینست که کلاستر معمولا برای اتصال ( نصب ) از شاید 0( input / out put) باس کامپیوتر استفاده می کند .

درصورتیکه ملتی پرسسورها معمولا به باس حافظه کامپیوتر وصل می شوند .

و باس حافظه از باند پهن تری استفاده می کند و اجازه میدهد که پروسسور شبکه باسرعت بیشتری کار کرده و خطاهای کمتری در مقایسه با I/0 ترافیک و کاربری دارد .

جدول 9.12 .

خصوصیات کلاسترهای موجود در سال 1997 در جدول فوق همه بجز IBMSP2 برای استفاده های بزرگ عرضه گردیده و SP2 برای استفاده ومعنی کردن داده ها بکار میرود .

و آخرین ضعف کلاستر تعدد حافظه است .

یک کلاستر با N ماشین دارای N حافظ مستقل و N کپی از نحوه کار دستگاه را دارد در صورتیکه پردازشگرهای چند منظوره مشترک یک برنامه دارد که کل حافظه ها را در کامپیوتر بکار میگیرد . بنابراین یک برنامه مشابه در کلاستر 1/N حافظه موجود در مقایسه باعث به خود smp را دارا میباشد . گرچه که حافظه های مجزا در کلاستر نوعی ضعف شمرده میشود ولی حقیقتا یک نوع مزیت از نظر مسایز برنامه و اعتبار سیستم و قابلیت گسترش آن بشمار میاید . بنابراین در کلاستر که دارای کامپیوترهای مجزا و متصل بهم از طریق شبکه میباشد بمراتب تعویض یک سیستم در آن ساده و نیازی به اینکه کل شبکه را از مدار خارج کنیم ندارد در قیاس با SMP .

و نهایتا سیستم با آدرس های مشترک بدین معنی است که مشخص کردن یک پروسسور و جایگزین کردن آن بمراتب مشکل تر است برای سیستم در حال کار ، چونکه نرم افزار کلاستر لایه ای است که روی سیستم در حال کار نصب گردیده و درهر کامپیوتر جداگانه فعال است و تعویض یک دستگاه معیوب در چنین سیستمی بسیار ساده است .

نتیجتا اینکه کلاسترها از کامپیوترهای مستقل با تمام متعلقات ساخته شده اند و توسعه و ارتقاء شبکه هم ساده و نیازی به پائین آوردن ( خاموشی دادن ) کاربری دستگاه نمی باشد .

امتیازاتی مانند فراوانی ، سرعت ، قابلیت گسترش باعث میشود که کلاسترها جاذبه بیشتری برای بکارگیری در (www) wordwide web داشته باشد .

اختلاف دیگری که بین این دو سیستم در کاربری وجود دارد قیمت محاسبه شده برای دو سیستم مشابه میباشد .

از آنجا که کامپیوترهای بزرگ با پردازشگرهای چند منظوره دارای حجم کوچکی هستند ، گسترشهای اضافی آنها هزینه زیادی داشته که روی سیستم اثر میگذارد و در نتیجه برای خریداران گرانتر تمام میشود .

از آنجائیکه از سویچهار مشابه در حجم زیاد برای سیستم های کوچک استفاده میگردد ، میتوان از ترکیب آنها برای ساخت کلاسترها در حجم بزرگ استفاده کرد و اغلب مثل دو طرف یک مسابقه که سعی برین دارند که از دیگری سبقت گرفته و جاذبه بیشتری ایجاد نمایند ، دریک طرف مسابقه ( دوئل ) برای پیروزی بر ضعف فراوانی بالایی مولتی پروسسورا سازندگان سخت افزاری و ارتقاء دهندگان سیستم سعی دارند توانایی را در دستگاه ایجاد کنند که تمام قسمتهای سیستم کار آئی بالائی داشته باشند که درینصورت یک Node خواهد توانست ارتقاء داده شود یا اگر ایرادی پیدا کرد ، سوی بقیه سیستم موثر نباشد . در طرف دیگر دوئل به علت اینکه محدودیت سیستم مدیریتی هر دو دستگاه و اندازه حافظه آنها تقریبا از یک حالت خطی ( افقی ) در تعداد ماشین برخوردار است ، مشکل کلاستر را با استفاده از SMP های کوچکتر تا اندازه ای حل کرده مثلا یک کلاستر 32 پروسسوری را میتوان با استفاده از چهار SMP هشتائی یا هشت SMP چهارتائی ساخت ، که چنین کلاستری را گاهی اوقات clusteved- shared – memory ( حافظه های مشترک خوشه ای ) میماند و درین نوع سیستم تمام موارد ، اقتصادی ، کاربری ، قابلیت توسعه و موجود بدون در نظر گرفته شدن بجز آنها ئیکه درشکل 9.12 برمبنای SMP ساخته شده اند .

پاراگراف بعدی 906 شبکه های را توضیح میدهد که از هر دو سیستم کلاستر و مولتی پروسسور استفاده می کند .

راه مستقیم برای اتصال حافظه – پردازشگر نادها ، ایجاد یک ارتباط بین هر ناد است .

بین این اجرای گران قیمت این شبکه کامل متصل و هزینه ارزان اجرای باس ، یک سری شبکه وجود دارند که 906 تشکیل یک سطح وسیعی از هزینه اجرائی را میدهد . هزینه شبکه شامل تعداد سویچ ها ، تعداد لیگ ها ، و طول لیگ ها وقتی که شبکه ترسیم میشود میباشد مثلا برای یک ماشینی در حد ده ها و صدها پردازشگر بعضی از لیگها ممکن است قوطی آهنی باشد با چیپ هائی که نزدیک یک مایل طول داشته باشند و بقیه ممکن است کابلهائی باشد با مترها طول از یک کابینت به دیگری . اجای یک شبکه هم کاملاشبیه کار بالا است . و آن در برمیگیرد یک شبکه بدون باری که پیام را ارسال و دریافت میکند ، کل ارسال به معنی حداکثر پیامهائی که میتواند در یک زمان معین بفرستد میباشد و تاخیر درین ارسال به لحاظ نوع اتصالات واجراهای متغیر که به چگونگی ارتباط فی ما پیش بستگی دارد است .

یک ملاحظه دیگر درین شبکه ممکن است درصد ایراداست ممکن باشد چونکه سیستم های بزرگ و ( پیشرفته ) باید با وجود بروز اشکال در شبکه کار آن متوقف نگردد . شبکه ها معمولا بصورت گراف رسم میشوند که هر are درین گراف نمایشگر یک اتصال ( link ) ارتباطی شبکه است . نادهای پردازشگر حافظه بصورت مربع های سیاه نمایش داده میشوند ، سویچها بصورت دایره های رنگی ، درین قسمت تمام اتصالات دو قطبی هستند یعنی اطلاعات در هر جهتی میتوانند جریان داشته باشند ، و تمام شبکه ها دارای سویچ هائی هستند که Links هایشان به پردازشگر حافظه و سایر سویچ ها میروند . اولین پیشرفت در باس ها اینست که شبکه آن بصورت نادهای هم فاز ( سی کووینس ) متصل شد باشند . که به این توپولوژی ( نوع اتصال ) رینگ ( حلقه ) گفته میشود . و چون بعضی از نادها بطور مستقیم وصل نمیشوند بعضی از پیام ها برای پیمودن طول مسیر ، مدتی طول میکشند تا به انتها برسند .

برعکس باس ، ریگ توانائی هدایت تعداد زیادی را بطور همزمان دارد . بدلیل اینکه توپولوژی ها متعددی وجود دارد برای تشخیص و انتخاب این طرحها نیاز به اندازه گیری دقیق میباشد که درین رابطه دو رویه آن معروفیست اول : باید عرضی کلی باند شبکه را دانست ( تعداد بیت ها برلینگ = پهنای باند ) که از بندویروس هر کدام از لینگها × ( ضربدر ) تعداد لینگها بدست میاید . که این بهترین مورد است . مثلا برای یک شبکه با p عدد لینگ ، B.W ( بندویروس ) کلمی برابر خواهد بر با Link × Pولی B.W کلی یک باس = خواهد بود باLink ×B.W 1

همان باس به تنهائی .

برابر قراری بهترین موقعیت ، یکنوع متر یک دیگری که تقریبا بدترین مورد است ، بندویدس ( B.W ) دو قسمتی است .

این نوع ، ماشین را بدو قسمت مجزا تقسیم کرده که هر قسمت 2/1 ناد را شامل میشود و بعدا ، باید B.W هائی را که از خط فرضی تقسیم شده آن نقطه گذشته اند با هم جمع کنیم . B.W دو قسمتی یک رینگ دو برابر B.W لینگ است و یک برابر لینگ برای نوع باس . اگر یک لینک تنها همان سرعت باس را دارد ، رینگ دو برابرآن سرعت را در بدترین حالت خود دارد ولی همان رینگ P برابر سریعتر است در بهترین موقعیت خود .

از جائیکه توپولوژی ( نقشه ) ها مشابه نیستند ، سئوال پیش میاید که خط فرضی مذکور را کجا باید رسم کرد تا کاملا سیستم را بدو قسمت تقسیم کند . که این بدترین حالت متر یک است .

بنابراین باید تقسیمی را انجام داد که حداکثر در اجرا بوجود میاورد . بدینصورت که متغیرها را ثابت کرده ، تمام تقسیمات ممکن ار محاسبه کنیم ، و کوچکترین را انتخاب کنیم ، این منظر بدبینی را به این دلیل انتخاب میکنیم که اکثرا برنامه های پارالل بوسیله ضعیف ترین لینگ در چرخه ارتباط محدود میگردند .

در شاخه ای دیگر از یک رینگ یک شبکه کاملا بسته شده وجود دارد بصورتیکه هر پردازشگر دارای لینگ دو جهتی به پردازشگر دیگر باشد ، محاسبه B.W کلی با کل سیستم دوجهتی از فرمول بدست میایدP-1) 2 × B.W , ( P دو قسمتی از فرمول (P/2)2 محاسبه میگردد .

ازدیاد توسعه شبکه کامل اجرائی از نظر هزینه قدری نگران کننده است و این امر باعث گردیده که با این الهام مهندسین و اداء به اختراع طرحی ( توپولوژی) که هزینه آن بین روش حلقه ای و شبکه های کامل ( فولی کنتکید نتورک ) باشد . و ارزیابی موفقیت این طرح بستگی عمده ای به قسمت ارتباط در شبکه دارد .

تعداد توپولوژی های که در نشریات منتشر شده اند قابل شمارش نیست اما تعدادی که تاکنون در پروسسورهای تجاری بکار گرفته شده اند در دست میباشد . ( مشخص است ) .

شکل 9.13 دو نوع مشهور آنرا نشان میدهد . سیستم اصلی ( حقیقتی ) گاها برای ارتقاء توانائی دستگاه تعدادی لینگ به آن اضافه میکند .

شکل 9013 : نقشه ( طرح ) شبکه ایکه شبکه های پارالل پروسسور برآن اساس طرح گردیده .

دایره های رنگی نشاندهنده سویچ ها و مربع های مشکی نشانگر پروسسور محوری ناد هستند ،حبی اگر سویچی چندین لینک داشته باشد ،معمولا فقط یکی از آنها به پروسسور میرود . نقشه ای با n عدد مکعب یک n عدد و جهی است بتوان 2 ناد که بهم متصل گردیده اند ، یاز به n عدد لیک برای هر سویچ باضافه یک برای پروسسور دارد و بنابراین n عدد از نزدیکترین ناد . در اغلب این نقشه ها تغیراتی داده شده برای ارتقاء قابلیت اجرا و تداوم کار مثلا سویچهای متصل شده به چپ راست ستون در 2-D میتواند از طریق سویچهای خالی وصل گردد و برای ساخت ریگ های افقی .

یک طریقه برای قرار دادن پروسسور در هر یک از نادهای یک شبکه اینست که سویچ در بعضی ازین نادها قرار دهید . و درینصورت از نظر جاسازی متراکم خواهد بود ، که در نتیجه اجرای بیشتری در فاصله کمتری خواهد گردید . به چنین شبکه ای غالبا چند شبکه ای گفته میشود که اطلاق میشود به چند مرحله ای که یک پیام باید گذر کند . و انواع شبکه های چندتائی زیاد هستند مانند شبکه یک قسمتی single-stage net شکل 9.14 سازمان دوعدد مولتی استیج رایج را نشان میدهد . شبکه (a ) کروس بار یا فولی کنکتد طوری طرح گردیده که هر ناد با ناد دیگری از طریق یک مسیر در ارتباط است . ( b ) شبکه اومگا کار کمتری نسبت به کروس بار میبرد ( سخت افزاری ) ( 2n 10y2 n70 sn2 sw) ، اما بین پیامها ارتباط میتواند برقرار گردد که بستگی به طرح ارتباطی شبکه دارد . مثلا در شکل 9014 و شبکه اومگا نمیتواند بطور همزمان از pot0p6 پیامی بفرستد وقتیکه در همان زمان از p1 t0 p7 میفرستد .

تکمیل کردن توپولوژی های شبکه یا تکمیل نقشه های یک شبکه
این تحلیل ساده در تمام شبکه ها درین قسمت ( رد میکند ) نقطه نظرهای ( ملاحظات ) عملی را در ساخت شبکه در میکند فاصله هر لینک در ارتباط مربوطه اثر جزئی سریعی دارد ،هرچه فاصله بیشتر باشد هر نیمه کاری در یک های کلاک ریت بیشتر است . و فاصله کوتاه متر کار اتصال دایرهای بیشتری به لیک را آسانتر میکند ، و برق مصرفی هم با وایرهای کوتاه تر کمتر میشود و هم چنین وایرکوتاه تر ارزانتر هم تهیه میشود . و محدودیت نهائی این طریق اینست که نقشه های سه بعدی که که باید روی چیپها و بردها پیاده گردیده ، ضرورتا دوبعدی هستند .
907: Real stopp : puture Directican For Multiprocessors:

دروغهای واقعی :

جهت گیری های آینده مولتی پروسسورها :

برای تجاوز از یک ده است که گفته میشود که جدال برسراینست که سازمان کامپیوترهای تکی به حد نهائی خود رسیده و توسعه واقعی آنها فقط میتواند بصورت اتصالات داخلی تعداد زیادی کامپیوتر به این طریق باشد که با هم بصورت اشتراکی ( شرکتی ) کار کنند که نتیجه کار ادامه اعتبار پردازشگر های تکی خواهد بود .

در بهار 1967 کنفرانس کامپیوتری ها : اعتبار ( پایداری ) سینگل پروسسورها به توانائی کسب محاسبات در مقیاس بالا نزدیک گردید .

کارآئی پردازشگرهای تکی در یک حد پیش بینی نشده توسعه یافته است ، با همراهی میکروپروسسورهائی که ( با همراهی میکروپروسسوها ) . شکل شماره 10400 نشان میدهد که از 1987 سریعترین میکروپروسسورها سالیانه بیش از 50% آنها توسعه داده شده اند توسعه با این سرعت به سادگی حاصل نگردیده هزینه تقریبی ارتقاء آخرین پن تیوم (pro ) 400 میلیون دلار است .

ظرفیت حافظه آن در یک درجه بالائی ارتقاء یافته و از نظر زمانی هم طولانی تر از ارتقاء پروسسورها بوده .شکل 1014 در صفحه 22 نشان میدهد که DRAM5 ( درام ها ) ظرفیتشان را هر سه سالی 4 برابر ارتقاء میدهند . وحشت از اذدهام توسعه سرمایه گذاران و ارزان بودن DRAMS ، تمام کارخانه های سازنده کامپیوتر و هم چنین و کمپانیهای سازنده پروسسور وادار کرده که حافظه هایشان را با استفاده از DRAMS سازند .

آخرین تکنولوژی درین رابطه اتصال داخلی شبکه میباشد . B/W اتصال داخلی شبکه توسعه یافته به دلیل ازدیاد سرعت منطقی در بسته بندی پارالل پروسسور 4 . و ازدیاد در سرعت فیزیکی لینگها برای مثال حداکثر بند ویدسی در هر لینگ دریک ده مدت ده سال از 5MB/sec . ( 2/1 مگا بارت بر ثانیه ) intel ipsc 1986 به 800 MB/see ( 800 مگا بایت برثانیه ) رسیده در sol oriyln 1996

بنابراین سه تکنولوژی موجود برای پارالل پروسسور برای طراحان عبارتند از : 1- میکروپروسسورهای سریع 2- ظرفیت بالا ی DRAMS و 3- ازدیاد B/W شبکه ، جالب اینکه هر سه قابل ارتقاء در یک میزان تناسبی هستند .همانطوریکه قبلا گفته شد ، تغییر سریع در چند پردازشگر تجاری به امارهازه داد که از ماشینهائی استفاده کنیم که نشان دهد ( ترسیم کند ) این عقاید را در www که گاها میتوانیم از عهده کهنه ماندن ( درجازدن ) برآئیم .
Facts Oflife for large – scule parallel pro cessors
حقایق ماندن ( ماندگاری ) پروسسور های موازی بزرگ .

هیجانات و دورنمای ساخت سریعترین کامپیوترهای جهان براساس حقیقت های وجودی طراحان را وادار به ساخت پردازشگر های موازی کرده حقیقت اول اینست که نادها خیلی شبیه به کرهای دسک تاپ ها هستند ، و بنابراین هزینه یک پروسسور موازی بزرگ با دسک تاپ قابل قیاس است .

اکثر سوپر کامپیوترها کمتر از 000/000/25 دلار برای حافظه و پروسسورشان هزینه دارند در صورتیکه قیمت دسک تاپ بین 2500 تا 000/10 دلار باقیمانده ، و اگر قیمت نادها میتوانست با دسک تاپ ها منطبق باشند ، بزرگترین پردازشگر موازی از 2500 تا 000/10 بیشتر هزینه نداشت . این پیش بینی هزینه اتصالات داخلی شبکه را شامل نمیشود حتی اگر با تعداد ناد کمتری ساخته شود . چنانکه خیلی از کامپیوترهائی که برای مصارف علمی بکار میرود با قیمت پائین تری خریداری میشوند و البته این دستگاهها بمراتب نادهای کمتری نسبت به نوع عملی آن دارند . بنابراین وقتیکه محدودیت عملی تعداد پروسسورها از 1000 تا 000/10 عدد میباشد ، برای خیلی از مصارف و مشتری 4 تعداد 100 پروسسور کافی خواهد بود .

در 1977 اغلب چند پروسسوری ها به میزان 8 تا 16 پروسسور داشتند که مقدار آن به آرامی بالا میرفت اگر 95% ماشینهای فروخته شده کمتر 100 عدد پروسسور داشتند ، 5% باقیمانده میبایست نیاز به تحقیق و توسعه بیشتر و در نتیجه قیمت بیشتری در هر ناد داشتند .

نقشه ( مدارات ) اتصالات داخلی شبکه ای که از 100 به 000/10 ناد ، توسعه داده میشود نیز از اهمیت زیادی برخوردار است . بهترین نقشه 100 تا 500 نادی ممکن است مناسب برای 1000 تا 10000 نادی نباشد بنابراین نقشه و بسته بندی هر دستگاه ممکن است با حداکثر تعداد ناد 4 تغییر کند . البته نقشه های اتصالات داخلی شبکه ها خصوصی برای انتخاب وجود دارد و خرید اینکه این راه حل ها و نکات مهم رعایت شود در نقشه ها بر قیمت دستگاه افزوده میگردد و متاسفانه به این دلیل است که تمام کمپانیها تنها از یک نقشه پردازشگر موازی تبعیت میکنند .

دلیل دوم برای اهمیت کمتر نقشه ها اینست که در صد خطای نقشه با الگوریتم آن هم خوانی ندارد چونکه تعریف یک اشکال در ناد یا لینک باعث میگردد گاهی اوقات پیام مسیرهائی غیر از آنکه برنامه نویس تعیین کرده ، دنبال کند . درصد خطاخیلی مهم است چونکه یک ماشین با 000/10 ناد که هرکدام شبیه یک دسک تاپ کامپیوتر هستند میبایست یک حدی برای درصد خطا داشته باشد چون هر خطا درین ماشین 000/10 برابر بدتر از یک دسک تاپ است . بنابراین در پروسسورهای بزرگ موازی مسئول اینست که چند تا از قطعات ایراد پیدا میکنند نه اینکه چه چیزی و چه وقت ممکن است خراب شود . پردازشگر های موازی باید با بروز اشکال در لیک شبکه و ناد ، بکار خود ادامه دهند . ازینرو پردازشگرهای بزرگ موازی تابع الگوریتم مخصوص نقشه نیستند حتی اگر ارتباط کلی کم گردد .
Hardware software imter face
انیترفیس نرم افزاری ، سخت افزاری :

کمبود نقشه استاندارد و مانع کوچکتری در برنامه های پروسسورهای موازی است از آن که انتظارش را دارید . یک دلیل اینست که هزینه ارسال یک پیام نرم افزاری بقدری زیاد است که اثر نقشه را خنثی میکند ( میپوشاند ) . بعبارتی دیگر این هزینه ( زمانی ) بقدری زیاد است که زمان لازم برای ارسال به پیام به نزدیکترین گره ( ناد ) مشابه زمان ارسال برای دورترین آن . در بعضی موارد هزینه بالاست چونگه قرار داد طوری است که باید پیامهای طولانی بفرستد ، گاهی اوقات با پایپلینگ آنها تاخیر فقط یکبار دیده میشود .

دلائل دیگر برای های اورهد ( هزینه بالا ) درخواست از سلیم در حال کار است برای ارسال یا دریافت پیام و هم چنین یک تداخل اندک مابین پردازشگر و شبکه است .

در مجموع عوامل ذیل پائین آورنده الگوریتم مخصوص نقشه است :

کمبود نقشه های استاندارد جور شده با اهمیت برنامه های پردازشگر موازی در موفقیت تولید کننده

هزینه بالای ارتباطی واقعا باعث همان تاخیر پیامهائی که بی نیاز از فاصله بین نادها ( گرها ) است

کارکردن با وجود بروز اشکال لینک ها یا نادها ( گره ها ).
: The big picture
یک راهنمای خواص برنامه های موازی فرکانس ارتباطی و همزمانی آنهاست .

ماشین های بزرگ موازی حافظه های توضیع شده دارند ( تقسیم شده ) باند پهن و هزینه پائین حافظه های داخلی ( محلی ) در قیاس با حافظه های غیر محلی ( غیر محلی ) ، باعث میگردد که برنامه نویسان پردازشگرهای موازی از نوع محلی استفاده کنند .

Massive pavallelism : انبوه موازی گراها

واژه انبوه موازی ، زیاد بکار برده میشود ولی ندرتا معنا دار میشود ( انجام میشود )

هیچکس پیدا نخواهد کرد کامپیوتری با کمتر از 100 پردازشگر از نوع انبوه موازی حتی با خط تولیدی چنین محتاطانه کامپیوترهائی که بیش از 100 عدد پردازشگر دارند هنوز در محاسبات روزانه از اهمیتی چندانی بخوردار نیستند .

ما باید یک مدل ساده داشته باشیم که برنامه نویسان بتوانند بسادگی تولید انبوه داشته باشند .

908 برنامه های قابل حمل موازی که کار آتی خوبی دارند درچند پردازشگر های واقعی و این امر جستجوگران را قادر به اختراع الگوریتم های جدیدی میکند که در اکثر چند پردازشگر ها به خوبی کار میکند . متاسفانه تعداد کمی از مدل های تئوری برای محاسبات موازی دقیقا نیاز روند بازار را از چند پردازشگر های تجاری پیش بینی کرده است .

– یک رویداد جالب برای پردازشگرهای موازی متیسیو (MPP ) سرعت بخشیدن استراتژی محاسبات اولیه است ، ( Asell ) ، برنامه برای ایجاد حرکت سریع با سفارش تعداد کمی ماشین 50 تا 100 میلیون دلار هزینه بر میدارد . یک سری از Asel پیشرفته تا حدود loo-Tera Flops سوپر کامپیوتر در اوائل قرن آینده ساخته خواهد شد .

شکل 9015 اولین سه نمونه Asel ماشین را نشان میدهد . در دسامبر 1966 حافظه های توضیعی چند پردازشگرهای پیام از اینتل CAsci ReD اولین کامپیوتری بودند در سطح 1Tera Flops ( یک میلیون MFLOPS ) .

شکل 9015 و خواص سوپر کامپیوتر Asci را نشان میدهد .

همه ماشینها دارای حافظه توضیعی هستند بجز فقط sl ماشین که از طریق یک آدرس مشترک ارتباط برقرار میکند و از نوع کش کوهرنت میباشد . و قیمت هر کدام بترتیب طبق شکل مذکور 46 و93 و 110 میلیون دلار است .

درمورد پردازشگرها موازی چالشها و غفلتهای زیادی وجود دارد که مبهم مانده اند که درین بحث به سه مورد از آنها اشاره میشود .

اندازه گیری زمان اجرای پردازشگرهای موازی با شتاب خطی .

برای قضاوت در مورد پردازشگرها موازی مدتها از مطالعه ، مقایسه گرافها و نقشه های اجرائی نسبت به تعداد پردازشگرها که نشان دهنده یک رشد سریع و یک توقف خطی و بعدا سقوط بود استفاده میگردید . هم چنین میزان ارتقاء پذیری هم یک وجه از برنامه های موازی آن بود که اندازه گیری غیرمستقیم بشمار میاید . اولین سئوالی که مواجه میشویم برق مصرفی پردازشگرهائی است که مورد سنجش قرار گرفته اند . برنامه ای که بصورت خطی اجرا را به اندازه 100 عدد اینتل ( 8086 ) بالا ببرد ممکن است کندتر از یک مدل بهتر از در یک دیسک تاپ پنتیوم PRO باشد .

مواظب قدرت مخصوص ممیز شناور سخت افزاری برنامه ها باشید ،چونکه پردازشگربدون کمک ممیز شناور سخت افزاری ممکن است ارتقاء تعجب آوری داشته باشد اما در مجموع اجرای ضعیفی خواهد داشت .

بررسی نتایج استفاده از شتاب دهنده خطی یا زمان کار میتواند برنامه نویس را گمراه کند به همان اندازه که از شکوائیه های برنامه نویسان شنیده میشود . در صورتیکه تعداد پردازشگرها زیاد باشد برنامه های با سرعت پائین تراز برنامه های سرعت بالا سریعترند .

اگر بهترین الگوریتم هر ماشین فقط با زمان اجرای آن مقایسه گردد ، این زمان اجرا رضایتبخش نخواهد بود . ( البته وقتیکه پردازشگر موازی را ارزیابی میکنید نمیتوان زمان را نادیده گرفت ، بنابراین زمان برای اندازه گیری cpu پردازشگرهای موازی درست نیست ) .مقایسه کدهای مشابه نیز ممکن است درست نباشد ، اما اینطور نیست . برنامه های موازی ممکن است در یک پردازشگر تکی کندتر از پردازشگر نوع متواتر است . گاهی اوقات توسعه یک برنامه موازی به توسعه الگوریتمی آن خواهد انجامید . بنابراین مقایسه بهترین نوع که مناسب نبود الگوریتم نادرست را مقایسه می کرد . برای انعکاس این نظریه گاهی اوقات واژه سرعت مناسب بالا ( همان برنامه و سرعت حقیقی بالا ( بهترین برنامه ها ) بکار میرود .

در سال 1987 دیگر پژوهش سازمانی عنوان کرد که قانون آمدال بوسیله ماشین های چند پردازشگری باطل اعلام گردید . برای درک ماخذ گزارشات رسانه ای ، بهتر است گفته ای که قانون فوق را تشریح میکند بررسی کنیم : یک نتیجه گیری ساده که ازین جهت بدست میاید اینست که تلاشهای فراوانی برای بدست آوردن پردازشگرهای موازی سطح بالا تاکنون هدر رفته .

این بیانیه هنوز باید درست باشد که قسمت غفلت شده برنامه اجرا را محدود میکند.

تفسیر یک قانون نیاز به توضیحات زیر را دارد : قسمت های مختلف هر برنامه باید متواتر باشد ، بنابراین هزینه سیستم نسبت به پردازشگرهای موجود بالا خواهد بود مثلا عدد 100 در نظر گرفته شود با نمایش دادن شتاب خطی با 1000 پردازشگر توضیحات گفته شده بالا رد شده و بنابراین . ادعای عدم صدق قانون امدال هنوز باقیست .

محققین به این نتیجه میرسیدند که ورودی را به بنچ مارک تبدیل کنند ، عوض اینکه 1000 بار سریعترش کنند . آنها 1000 برابر کار را در مدت زمان قبل محاسبه کردند یعنی 1000 بار جلوتر افتادند . برای الگوریتم آنها قسمت متواتر برنامه ثابت بود ، به همان اندازه ورودی و بقیه کاملا موازی بودند ، در نتیجه شتاب خطی با 1000 پردازشگر بسادگی کار برد افزایش پیدا کرد بدون اینکه حتی دقت ممیز شناور تعداد درگیری ها ، نیازمندی ورودی خروجی ها بالا برود . و نحوه برخورد با خطاها ممکن است یاده باشد . تعدادی از کاربردها اگر مشکل بصورت ناخواسته بزرگ گردد نتیجه را محاسبه نخواهند کرد . دلیلی وجود ندارد که چرا قانون آدال در ورد پردازشگرهای موازی صدق نمیکند . آنچه که این تحقیق بدست میاورد اینست که داشتن نوع بنچ مارکی که بتواند به اندازه ای

ارتقاء داده شود تا قادر باشد کار پردازشگرهای بزرگ موازی را انجام دهد مهم است .

یک تعریف از اوج اجراء ، اجرایی است که ماشین ضمانت کرده نه آنکه اجرا نکرده . کارخانه سوپر کامپیوتر الاس ازین نوع تضمین در بازار استفاده میکند و اشتباه آن با ماشین های موازی تشدید گردیده است . نه فقط بازیاب کارخانه ها هاز غیر قابل وصول بودن اوج کار عملی کی پردازشگر ناد استفاده میکنند ، مثلا مثل سرعت کامل زیاد ، قانون ادال میگوید که چقدر مشکل است رسیدن به هریک از اوج ها ، ادغام دوتا با هم خطا را چند برابر میکند .

چنین ادعاهای اجرائی میتواند سازندگان را به همان اندازه مصرف کننده گان دچار اشتباه کند .

خطر اینجاست که سازندگان حافظه نرم افزاری را با این داوری که چون درصدی از اوج کار اندازه گیری شده توسعه خواهند داد بجای اینکه وقت کمتری صرف خواهد شد یا سخت افزاری اضافه خواهد شد که اوج اجرای ناد را زیاد کند اما استفاده از آن شکل خواهد بود .

روش سستی که حتی تواناترین دانشمندان هر نسلی برای از بین بردن اشتباهات مشاهده کرده اند ، فقر هدایت عمومی ، کافی نبودن فرمول ها بوده است و لطمه اصلی بزرگ را آنهائی زده اند که از انتشار علم و دانش خود در کتب خود داری کرده اند .

مطالعه مقالات و ژورنال های 30 سال گذشته میتواند دلسرد کننده باشد .

کوشش فراوانی برای حصول بسیار کمی انجام گردیده . با یک گفته خوش بینانه این نوشته جات پراکنده بصورت شن ریزه عمل میکنند ، ولی وقتی پهلوی هم چیده شوند . بصورت سکوئی برای نسل آینده کامپیوتر خواهد بود . از منظر بد بینانه ، اگر 90% این نظریه 4 مفقود گردد هیچکس توجهی نخواهد کرد .

یک دلیل برای این وضع بدسندرم ون نومان نامیده میشود ، به امید اینکه اختراع جدیدی در ارتباطات باعث انقلابی در محاسبات گردد . محققین سخت در تلاشند که ون نومان قرن 21 باشند . دلیل دیگر اینست که اغلب محققین میل دارند مسائلی که دیگران در نظر نمیگیرند انتخاب کنند . حتی اگر مسائل سهم انتخاب گردند کمبود تجربه باعث میشود که نتوان براحتی ارزش راه حل مناسب ارائه گردید ، ممکن است این راه حل نسبت به سود آن گرانترباشد . گاهی این اضافه بها بصورت ارزش افزوده محاسبه میگردد . اجرای این گرانی مزیتی ندارد و فقط هزینه را اضافه میکند گاهی اوقات هزینه اضافی به بدعت گذاری استفاده کننده گان بر میگردد . شکل 9018 طیف انقلاب تدریجی کامپیوتر را نشان میدهد .

در قسمت چپ نظریه هائیکه برای استفاده کننده قابل روئیت نیست وجود دارد ( بجز هزینه بیشتر ، عملکرد بهتر یا هردو ) این انتهای تدریجی طیف است و در انتهای دیگر عقاید انقلابی سازندگان وجود دارد اینها نظریه های ضروری هستند که برنامه نویسان جدید باید بیاموزند . زبانهای جدید برنامه نویسی ، مدل ها محاسبه داده ها ی جدید ، الگوریتم های جدید باید اختراع گردد .

برای چاپ نظریه های انقلابی از تدریجی آن ساده تر هستند ، اما تا به آنها عادت کنیم هزینه زیادی دارد . کش ها مثال توسعه تدریجی هستند ، در طول 5 سال بعد از چاپ اولین نشریه درباره کش ها ، هر کمپانی کامپیوتر دستگاهی با یک کش میساخت و کامپیوتر (Risc ) کم دستوری به میان طیف نزدیکتر بود ، و برای ساخت آن نزدیک به 10 سال طول کشید . نمونه های کامپیوتر انقلابی در اواخر دهه 1980 بوسیله تعداد زیادی از کمپانیهای پردازشگر موازی ببازار آمد . هر برنامه ای که اجرای مفیدی در آن ماشینها داشت یا اساسا اصلاح شده بود یا فقط برای همان ماشین نوشته شده بود ، برنامه نویسان نیاز داشتند روش جدید برنامه نویسی را برای آن بیاموزند ، برای کمپانیها موانع بسیار بزرگی بود که بتوانند دنباله آن بگردند .

پروژه ها ئیکه کمپانیهای کامپیوتر رد میکنند ، ممکن است مفید باشند ، در صورتیکه درسهای آموخته شده را برای فعالیتهای آینده پشت کنند . مشکل نداشتن یک معمار جدید نسبت بلکه عدم موفقیت از نظر تجاری میباشد . اما با چشم پوشی از ارزیابی در ضعف ، قوت و کمیت نظریه های جدید ، شکست در پروژه های گذشته به این معنی نیست که نظریه ها برای همیشه مردودند ، تغییرات در تکنولوژی ممکن است دوباره نظریات قبلی را تایید کند که قبلا عرضه غلط یا بازار کمی داشت یا اینکه قبلا از تکنولوژی جلوتری برخوردار بوده .

این مقدار از ورقه 10 نوشته شده

وقتیکه به آینده میاندیشیم و اختراع خود را به حوزه طیف انقلاب تدریجی معطوف میکنیم ، بخاطر داشته باشیم که قبول نظریه های سخت افزاری باید بیشتر در مورد آن بدانند و اگر اهالی سخت افزاری ماشینهای خوب میخواهند باید بیشتر در مورد سخت افزار بدانند تا بتوانند با آن ارتباط برقرار کنند و همینطور روی سخت افزاری مهندسان نیز اثر بگذارد . همچنین اصول سازمانی کامپیوتر که درین کتاب نوشته شده باید بخاطر بسپارند . اینها مطمئنا راهنمای کامپیوترهای آینده خواهند بود ، بهمان صورتیکه کامپیوتر های گذشته را راهنمائی کرده اند .

بدلیل اینکه موازی سازی میتواند در چندین سطح انجام گردد ، بهتر است که متغیرها را دسته بندی کنیم . در سال 1966 های فلین مدلی برای دسته بندی کامپیوترها ساخته که هنوز مورد استفاده قرار میگیرد . این دستگاه اغلب قطعات ماشین را بررسی کرده و تعداد دستورهای موازی را شمرده و هم چنین دسته های داده ها را نیز شمرده و مبدا کامپیوتر را براساس این شمارش نمره گذاری میکند که عبارتند از :

دسته ، یک دستور/ یک داده 1- sisd uniprocessor

دسته ، یک دستور / چند داده 2- SIMD

دسته ، چند دستور / یک داده 3- MISD

دسته ، چند دستور / چند داده 4- MIMD

تعدادی از ماشینها با این دسته بندی ها هم خوانی ندارند . اما بدلیل اینکه اینها ماشین های ساده و با کلالی هستند بصورت خیلی زیاد مورد استعمال قرار دارند . سادگی آنها بخاطر یادگیری ساده و بالای آنها ست .

اولین سئوال شما اینست که یکی یا چند تائی در مقایسه با چی ؟

ماشینی که 32 بایت در یک سیکل خود داشته باشد از نوع چند تائی ( multi ) خواهد بود در نقایسه با ماشینی که 32 بایت سیکل برای جمع بندی نیاز دارد .

ای فلین کامپیوترهائی که درآن زمان شهرت داشتند انتخاب کرده بعنوان مدل SISD ( یک دستور / یک داده ) مانند

IBM7090 , IBM 704

امروزه مدل های MIPS که در فصل 5و6 توضیح داده شده اند مناسب خواهند بود .

SIMD : کامپیوترهای یک دستوری چند داده :

این کامپیوترها روی محور داده ها کار میکنند مثلا وقتی که یک دستور SIMD تکی 64 شماره را جمع میبندد ، سخت افزار آن 64 دسته اطلاعات را به 64 ، ALU برای جمع بندی با یک چرخه کلاک انجام میدهد .

خاصیت SIMD اینست که تمام یونیتهای مختص موازی هم زمان هستند و همه به یک روش که از یک کامپیوتر یک برنامه ای ( P.c ) منتشر میشوند جواب میدهد . از منظر یک برنامه نویس این عمل خیلی شبیه به کار sisd های حال حاضر است . هم چنین هر واحدی مختص همان روش خواهد شد ، هر واحد آدرس مخصوص خودش را ثبت خواهد کرد و بنابراین هر واحدی میتواند داده آدرس های مختلفی داشته باشد تغییر و تحولاتی که متعاقب SIMD ها پیش آمد ، کم کردن هزینه 12 واحد کنترل اختصاصی میباشد . یک دلیل دیگر کاهش اندازه برنامه حافظه است . SIMD ها فقط به یک کپی از کدی که بصورت همزمان اجرا میشود نیاز دارد ، در صورتیکه MIMD ممکن است یک کپی در هر پردازشگر نیاز داشته باشد . حافظه واقعی و ازدیاد ظرفیت چیپهای DRAM اهمیت این مزیت را کاهش داده است .

SIMD های واقعی ترکیبی از دستورالعمل های SIMD,SISD دارند . یک گروه از SISD ها وجود دارد که محاسبات همزمانی مانند شاخه ها یا آدرس ها را اجرا میکند . روش SIMD به تمام واحدهای اجرائی ابلاغ شده ، واحدهای اجرائی روی اتصالات داخلی شبکه گسترده شده که اطلاعات را تعویض کنند .

SIMD ها وقتی که در برابر حلقه ها ( Loops ) قرار

  • milad milad
  • ۰
  • ۰

این متن دومین مطلب آزمایشی من است که به زودی آن را حذف خواهم کرد.

زکات علم، نشر آن است. هر وبلاگ می تواند پایگاهی برای نشر علم و دانش باشد. بهره برداری علمی از وبلاگ ها نقش بسزایی در تولید محتوای مفید فارسی در اینترنت خواهد داشت. انتشار جزوات و متون درسی، یافته های تحقیقی و مقالات علمی از جمله کاربردهای علمی قابل تصور برای ,بلاگ ها است.

همچنین وبلاگ نویسی یکی از موثرترین شیوه های نوین اطلاع رسانی است و در جهان کم نیستند وبلاگ هایی که با رسانه های رسمی خبری رقابت می کنند. در بعد کسب و کار نیز، روز به روز بر تعداد شرکت هایی که اطلاع رسانی محصولات، خدمات و رویدادهای خود را از طریق بلاگ انجام می دهند افزوده می شود.

  • milad milad
  • ۰
  • ۰

این متن اولین مطلب آزمایشی من است که به زودی آن را حذف خواهم کرد.

مرد خردمند هنر پیشه را، عمر دو بایست در این روزگار، تا به یکی تجربه اندوختن، با دگری تجربه بردن به کار!

اگر همه ما تجربیات مفید خود را در اختیار دیگران قرار دهیم همه خواهند توانست با انتخاب ها و تصمیم های درست تر، استفاده بهتری از وقت و عمر خود داشته باشند.

همچنین گاهی هدف از نوشتن ترویج نظرات و دیدگاه های شخصی نویسنده یا ابراز احساسات و عواطف اوست. برخی هم انتشار نظرات خود را فرصتی برای نقد و ارزیابی آن می دانند. البته بدیهی است کسانی که دیدگاه های خود را در قالب هنر بیان می کنند، تاثیر بیشتری بر محیط پیرامون خود می گذارند.

  • milad milad