Va trebui să fac check-out Hoard, Google Perftools și jemalloc cândva. Deocamdată, folosim scalable_malloc de la Intel Threading Building Blocks și funcționează destul de bine.
Pentru mai bine sau mai rău, folosim C ++ pe Windows, deși o mare parte din codul nostru se va compila cu gcc foarte bine. Dacă nu există un motiv convingător pentru a vă deplasa la redhat (linia principală de distribuție pe care o folosim), mă îndoiesc că merită durerea de cap / probleme politice să se miște.
Mi-ar plăcea să-l folosesc pe Erlang, dar există multe modalități de a face acest lucru acum. Dacă ne gândim la cerințele legate de dezvoltarea Erlang într-un cadru telefonic, acestea sunt foarte asemănătoare cu lumea noastră (comerțul electronic). Cartea lui Armstrong este pe mine pentru a citi stiva :)
În încercarea mea de a scala de la 4 nuclee la 16 nuclee, am învățat să apreciez costul oricărei blocări / controverse din partea paralelă a codului. Din fericire avem o porțiune mare care se scaldă cu datele, dar chiar și asta nu a funcționat la început din cauza unei blocări suplimentare și a alocatorului de memorie.